Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

ThumbShots-Bot

Alles zum Thema: Robots, Spider, Logfile-Auswertung und Reports
Neues Thema Antworten
Kristian
PostRank 9
PostRank 9
Beiträge: 1484
Registriert: 20.07.2005, 16:30

Beitrag von Kristian » 29.01.2008, 19:11

Hallo

Dieses Biest treibt sein Unwesen mit diversen Einwahl-IP's derzeit sind es noch ausschliesslich die der Telekomiker.
Was macht der? Er liest die robots.txt und fragt so um Erlaubnis ob er denn einen ThumbShot machen darf. Der Browser, der wo zum Bilder-Knipsen gebraucht wird kommt direkt hinterher. Gleiche IP aber Kennung eines FF.
Zum Aussperren reicht in der robots.txt ein Useragent der das Wort thumbshot enthält, wer thumbshots.de geblockt hat sperrt den Burschen mit aus. Der Stern * greift natürlich auch, sprich wenn der Bot nichts anderes findet fühlt er sich dadurch angesprochen. Auf Wunsch bringe ich ihm noch das Wort KFSW bei, wenn Ihr es für sinnvoll haltet.
IP's zum Sperren gibt es diesmal leider nicht, das System wird so laufen wie Seti@Home

Gruss
Kristian

Anzeige von ABAKUS

von Anzeige von ABAKUS »


Hochwertiger Linkaufbau bei ABAKUS:
  • Google-konformer Linkaufbau
  • nachhaltiges Ranking
  • Linkbuilding Angebote zu fairen Preisen
  • internationale Backlinks
Wir bieten Beratung und Umsetzung.
Jetzt anfragen: 0511 / 300325-0

shadaik
PostRank 4
PostRank 4
Beiträge: 135
Registriert: 03.10.2007, 16:47

Beitrag von shadaik » 29.01.2008, 23:01

Alleridngs finde ich eine Seite, die Suchergebnisse mit Screenshots der Seiten ausgibt nicht schlehct.

Oder übertreibt thumbshot es mit der Spiderei öfters (hab den bisher noch nicht gesichtet)?

Kristian
PostRank 9
PostRank 9
Beiträge: 1484
Registriert: 20.07.2005, 16:30

Beitrag von Kristian » 30.01.2008, 00:03

Hallo
shadaik hat geschrieben:Alleridngs finde ich eine Seite, die Suchergebnisse mit Screenshots der Seiten ausgibt nicht schlehct.
Oder übertreibt thumbshot es mit der Spiderei öfters (hab den bisher noch nicht gesichtet)?
Ich hoffe, dass er es nicht übertreibt, das wäre ein Fehler / Bug im Programm.
Die Realität ist eher, dass es schwer ist die Masse der Seiten, die er machen soll zu bewältigen.
Derzeit - über meine Leitung laufen gerade zwei Instanzen des Progs - sind das pro Tag max. 10.000 Seiten.
In der DB haben wir gerade 1,7 Mio Seiten / ThumbShots.
Rechne das mal hoch und vergleiche es mal mit der Zahl im Google-Index.


Gruss
Kristian