Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Netcraft WebCrawler

Alles zum Thema: Robots, Spider, Logfile-Auswertung und Reports
Neues Thema Antworten
Keyser Soze
PostRank 9
PostRank 9
Beiträge: 1414
Registriert: 07.09.2004, 08:58

Beitrag von Keyser Soze » 21.07.2007, 10:53

Liest keine robots.txt, ruft ~2 Seiten pro Sekunde ab, das rund um die Uhr. Es werden auch ständig nicht-existierende Seiten aufgerufen... dass da ein 404er zurückkommt und diese URLs auch definitiv nirgendwo verlinkt sind, scheint den Bot nicht im geringsten zu stören.
Nach einer Sperrung per .htaccess hören die Zugriffe nicht auf, sondern gehen unvermindert weiter (robots.txt darf er weiterhin lesen, tut es aber nicht).
Zugriffe erfolgen von cornucopia.netcraft.com - was zur Hölle ist das? Ich dachte bisher, Netcraft sei eine mehr oder weniger seriöse Webseite... :-?
[url=httpss://www.vermarktercheck.de]VermarkterCheck.de[/url] - Webseiten-Vermarkter im Vergleich

Antworten