Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

ThumbShots-Bot

Alles zum Thema: Robots, Spider, Logfile-Auswertung und Reports
Neues Thema Antworten
Kristian
PostRank 9
PostRank 9
Beiträge: 1484
Registriert: 20.07.2005, 16:30

Beitrag von Kristian » 29.01.2008, 19:11

Hallo

Dieses Biest treibt sein Unwesen mit diversen Einwahl-IP's derzeit sind es noch ausschliesslich die der Telekomiker.
Was macht der? Er liest die robots.txt und fragt so um Erlaubnis ob er denn einen ThumbShot machen darf. Der Browser, der wo zum Bilder-Knipsen gebraucht wird kommt direkt hinterher. Gleiche IP aber Kennung eines FF.
Zum Aussperren reicht in der robots.txt ein Useragent der das Wort thumbshot enthält, wer thumbshots.de geblockt hat sperrt den Burschen mit aus. Der Stern * greift natürlich auch, sprich wenn der Bot nichts anderes findet fühlt er sich dadurch angesprochen. Auf Wunsch bringe ich ihm noch das Wort KFSW bei, wenn Ihr es für sinnvoll haltet.
IP's zum Sperren gibt es diesmal leider nicht, das System wird so laufen wie Seti@Home

Gruss
Kristian

Anzeige von ABAKUS

von Anzeige von ABAKUS »


Hochwertiger Linkaufbau bei ABAKUS:
  • Google-konformer Linkaufbau
  • nachhaltiges Ranking
  • Linkbuilding Angebote zu fairen Preisen
  • internationale Backlinks
Wir bieten Beratung und Umsetzung.
Jetzt anfragen: 0511 / 300325-0

shadaik
PostRank 4
PostRank 4
Beiträge: 135
Registriert: 03.10.2007, 16:47

Beitrag von shadaik » 29.01.2008, 23:01

Alleridngs finde ich eine Seite, die Suchergebnisse mit Screenshots der Seiten ausgibt nicht schlehct.

Oder übertreibt thumbshot es mit der Spiderei öfters (hab den bisher noch nicht gesichtet)?

Kristian
PostRank 9
PostRank 9
Beiträge: 1484
Registriert: 20.07.2005, 16:30

Beitrag von Kristian » 30.01.2008, 00:03

Hallo
shadaik hat geschrieben:Alleridngs finde ich eine Seite, die Suchergebnisse mit Screenshots der Seiten ausgibt nicht schlehct.
Oder übertreibt thumbshot es mit der Spiderei öfters (hab den bisher noch nicht gesichtet)?
Ich hoffe, dass er es nicht übertreibt, das wäre ein Fehler / Bug im Programm.
Die Realität ist eher, dass es schwer ist die Masse der Seiten, die er machen soll zu bewältigen.
Derzeit - über meine Leitung laufen gerade zwei Instanzen des Progs - sind das pro Tag max. 10.000 Seiten.
In der DB haben wir gerade 1,7 Mio Seiten / ThumbShots.
Rechne das mal hoch und vergleiche es mal mit der Zahl im Google-Index.


Gruss
Kristian

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


shadaik
PostRank 4
PostRank 4
Beiträge: 135
Registriert: 03.10.2007, 16:47

Beitrag von shadaik » 30.01.2008, 12:10

Oh, ren Missverständnis: Ich hatte das mit einer SuMa verwechselt, die links neben dem Suchergebnis einen Sxcreenhsozt der Seite anzeigt.
Die fand ich klasse, hab sie aber bald wieder vergessen ob der schieren Präsenz von Google.

submitnine
PostRank 4
PostRank 4
Beiträge: 110
Registriert: 04.01.2008, 15:27

Beitrag von submitnine » 30.01.2008, 16:29

User-agent: thumbshots-de-bot
Disallow: /

Steht in deren FAQ drin.
Bild
Freue mich über Kommentare (no-nofollow) | Du hast einen kleinen/neuen Webkatalog? Msg me und ich Trag mich ein.

Kristian
PostRank 9
PostRank 9
Beiträge: 1484
Registriert: 20.07.2005, 16:30

Beitrag von Kristian » 30.01.2008, 19:39

Hallo
submitnine hat geschrieben:User-agent: thumbshots-de-bot
Disallow: /

Steht in deren FAQ drin.
Jo, das stimmt.
in meiner /bot.html steht:

Code: Alles auswählen

User-agent: ThumbShots-Bot
Disallow: /
Diese Kennung findet sich auch im Logfile.
Mir geht es darum, dass jemand der keine ThumbShots seiner Seite sehen will nicht genötigt sein soll jeden einzelnen Service einzutragen.
Von daher fühlt sich mein Bot angesprochen, sobald er das Wort thumbshot findet, Groß - und Kleinschreibung sind dabei egal.
Bei thumbshots.de wird es wohl in Kürze auch so sein, wer noch mitzieht, bzw. wer überhaupt die robots.txt liest ist eine andere Frage.

Gruss
Kristian

Antworten