Seite 1 von 1
Crawler vom Max-Planck Institur
Verfasst: 16.06.2005, 16:05
von Chris2005
Folgender Bot war heute bei mir.
Mozilla/5.0 (compatible;heritrix/@VERSION@+
https://www.mpi-sb.mpg.de/)
Kam von 192.166.194.129 gw-decryptos.hsd.de
Wenigstens haben sie eine Web-Adresse angeben.

Verfasst:
von
SEO Consulting bei
ABAKUS Internet Marketing Erfahrung seit 2002
- persönliche Betreuung
- individuelle Beratung
- kompetente Umsetzung
Jetzt anfragen:
0511 / 300325-0.
Verfasst: 16.06.2005, 17:27
von luigip
Such doch mal nach
heritrix auf
https://www.mpi-sb.mpg.de/.

Crawler vom Max-Planck Institur
Verfasst: 16.06.2005, 19:42
von Chris2005
Habe ich gemacht... No hits ... hast Du was gefunden?
Crawler vom Max-Planck Institur
Verfasst: 16.06.2005, 20:15
von ErwinRommel
Der könnte von hier gewesen sein:
https://crawler.archive.org/
Verfasst: 17.06.2005, 12:40
von luigip
@ErwinRommel
Aber nicht von archive.org selbst von der Leine gelassen, denn er kam über eine deutsche IP (Cronon AG, Berlin).
Crawler vom Max-Planck Institur
Verfasst: 17.06.2005, 12:50
von Chris2005
Ich denke, ich werde den Jungs da mal ne Mail schreiben. Von mir aus sollen sie crawlen, aber dann bitte mit Hintergrund-Info

Crawler vom Max-Planck Institur
Verfasst: 17.06.2005, 15:24
von SloMo
Das Internet ist öffentlich, da kann crawlen wer will. Wenn man jeden Webmaster erst um Erlaubnis bitten müsste, seine Webseite anzusehen... ich meine, das verlangt man doch von Google auch nicht. Seltsame Auffassung haste vom Internet.

Crawler vom Max-Planck Institur
Verfasst: 17.06.2005, 16:50
von mario
wem 192.166.194.129 nicht koscher ist, sperrt über die ip per deny
Re: Crawler vom Max-Planck Institur
Verfasst: 17.06.2005, 17:46
von Chris2005
SloMo hat geschrieben:Das Internet ist öffentlich, da kann crawlen wer will. Wenn man jeden Webmaster erst um Erlaubnis bitten müsste, seine Webseite anzusehen...
Das ist richtig. Aber wenigstens sollten sie eine Seite auf der Homepage einrichten wo über den Sinn und Zweck dieses Crawlers berichtet wird. Es gibt (habe die URL leider gerade nicht parat) auch so einen Uni-Crawler von irgendeiner Uni aus USA. Die schreiben brav, was sie machen und gut ist.
Ausserdem fragen kostet nix

und ist meiner Meinung nach auch nicht "ungezogen".
Crawler vom Max-Planck Institur
Verfasst: 17.06.2005, 17:59
von mario
Chris Deine Auffassung ist korrekt... Kirchen sind auch öffentlich und doch immer verschlossen. Warum sperrst Du den 192.166.194.129 nicht einfach aus? Was erwartest Du von denen?
Crawler vom Max-Planck Institur
Verfasst: 17.06.2005, 23:29
von Chris2005
Ich bin einfach nur neugierig. Wenn das irgendwelchen wissenschaftlichen Zwecken dient, dann sollen sie crawlen... Ist ja beim MPI auch anzunehmen.
Die Anmerkung mit den Kirchen ist gar nicht so falsch... Man muss vielleicht auch nicht alles wissen.