Seite 1 von 1

Crawler vom Max-Planck Institur

Verfasst: 16.06.2005, 16:05
von Chris2005
Folgender Bot war heute bei mir.

Mozilla/5.0 (compatible;heritrix/@VERSION@+https://www.mpi-sb.mpg.de/)

Kam von 192.166.194.129 gw-decryptos.hsd.de

Wenigstens haben sie eine Web-Adresse angeben. :x

Verfasst:
von
SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


Verfasst: 16.06.2005, 17:27
von luigip
Such doch mal nach heritrix auf https://www.mpi-sb.mpg.de/. :wink:

Crawler vom Max-Planck Institur

Verfasst: 16.06.2005, 19:42
von Chris2005
Habe ich gemacht... No hits ... hast Du was gefunden?

Crawler vom Max-Planck Institur

Verfasst: 16.06.2005, 20:15
von ErwinRommel
Der könnte von hier gewesen sein: https://crawler.archive.org/

Verfasst: 17.06.2005, 12:40
von luigip
@ErwinRommel

Aber nicht von archive.org selbst von der Leine gelassen, denn er kam über eine deutsche IP (Cronon AG, Berlin).

Crawler vom Max-Planck Institur

Verfasst: 17.06.2005, 12:50
von Chris2005
Ich denke, ich werde den Jungs da mal ne Mail schreiben. Von mir aus sollen sie crawlen, aber dann bitte mit Hintergrund-Info :evil:

Crawler vom Max-Planck Institur

Verfasst: 17.06.2005, 15:24
von SloMo
Das Internet ist öffentlich, da kann crawlen wer will. Wenn man jeden Webmaster erst um Erlaubnis bitten müsste, seine Webseite anzusehen... ich meine, das verlangt man doch von Google auch nicht. Seltsame Auffassung haste vom Internet. 0X

Crawler vom Max-Planck Institur

Verfasst: 17.06.2005, 16:50
von mario
wem 192.166.194.129 nicht koscher ist, sperrt über die ip per deny

Re: Crawler vom Max-Planck Institur

Verfasst: 17.06.2005, 17:46
von Chris2005
SloMo hat geschrieben:Das Internet ist öffentlich, da kann crawlen wer will. Wenn man jeden Webmaster erst um Erlaubnis bitten müsste, seine Webseite anzusehen...
Das ist richtig. Aber wenigstens sollten sie eine Seite auf der Homepage einrichten wo über den Sinn und Zweck dieses Crawlers berichtet wird. Es gibt (habe die URL leider gerade nicht parat) auch so einen Uni-Crawler von irgendeiner Uni aus USA. Die schreiben brav, was sie machen und gut ist.

Ausserdem fragen kostet nix :) und ist meiner Meinung nach auch nicht "ungezogen".

Crawler vom Max-Planck Institur

Verfasst: 17.06.2005, 17:59
von mario
Chris Deine Auffassung ist korrekt... Kirchen sind auch öffentlich und doch immer verschlossen. Warum sperrst Du den 192.166.194.129 nicht einfach aus? Was erwartest Du von denen?

Crawler vom Max-Planck Institur

Verfasst: 17.06.2005, 23:29
von Chris2005
Ich bin einfach nur neugierig. Wenn das irgendwelchen wissenschaftlichen Zwecken dient, dann sollen sie crawlen... Ist ja beim MPI auch anzunehmen.

Die Anmerkung mit den Kirchen ist gar nicht so falsch... Man muss vielleicht auch nicht alles wissen.