Ein verteilter Uni-Crawler mit dem berüchtigten 0-Byte-Längenbug?
Den Bug hatte der IRLbot auch - nur dass damals der Crawler nicht weiter spiderte (Botrechner abgestürzt? ).
Wenn der Bot zu aufdringlich wird, schreib ein Byte (z. B. 0x0A, 0x04 oder auch Glockenläuten mit 0x07 ) in die robots.txt und warte ab was dann passiert.
Leute mit zu viel Zeit können alle betroffenen Uni-Rechenzentren anschreiben.
das könnte durchaus Sinn machen ;- ) - zumal ja einige Uni-Seiten unter den Spidern sind. Ach ja, die spidern immer noch und ich habe jetzt mal ein <space> reingeschrieben...
Obwohl sie schon vorher seltener geworden sind, sind die Bots nach dem Einfügen eines Leerzeichens heute das erste mal ausgeblieben. Das könnte man, nach dem massiven Auftreten zuvor, praktisch als sicheres Zeichen werten, dass da wirklich ein "zero-filesize-problem" bei irgendwelchen "Unibots" existiert hat.
Vielen Dank thetrasher, Du hast die Logs von mir wirklich gut gelesen... ;- )