Seite 1 von 1

Googlebot-IP

Verfasst: 01.08.2008, 09:45
von muemmel_0811
Hallo Ihr,

kann mir einer von Euch eine IP-Adresse nennen, die nachweislich NICHT der Googlebot ist, aber sich in den Apache-Logfiles als solches ausweist.

Hintergrund ist ganz einfach: ich versuche gerade mit meinem Halbwissen ein kleines Tool zu programmieren, dass mir eben sagt, ob Eintrag x wirklich vom Googlebot ist oder nicht. Und da bräuchte ich halt mal so eine Adresse, damit ich mein Programm auf Richtigkeit überprüfen kann.

Und ja, ich weiß auch, dass es eine Unmenge an Skripten gibt, die das bereits machen, aber ich möchte es halt selber hinbekommen :)

Verfasst:
von

Verfasst: 01.08.2008, 09:56
von Airport1
bot-trap einbauen, page.restrictor.log mit schreibrechten versehen und einbinden mit

define('PRES_CHECK_GOOGLEBOT', TRUE); // ist wegen aengstl. naturen aus
require_once('page.restrictor.php');

ggf. etwas warten, je nachdem wie stark die seite frequentiert wird. dann:

cat page.restrictor.log | grep botfake

liefert mir bspw. fuer gestern 2 botfakes.

aber das hat eigentlich weniger mit einer ip zu tun, als mit dem faelschen des uas. matched der ua auf googlebot machste einen forward und reverse resolve und pruefst ob ip und dns name wirklich zusammenpassen. das wars ,)

Verfasst: 01.08.2008, 10:07
von muemmel_0811
:o: ich hab doch was von Halbwissen geschrieben...
Spaß beiseite, mir würde für den Anfang wirklich nur eine Falsch-IP-Adresse genügen, bevor ich mich mit sonstigen Gegenabfragen und Co beschäftige.

Verfasst: 01.08.2008, 11:19
von muemmel_0811
so, hat sich erledigt, hab jetzt selbst eine in unseren Logfiles gefunden :)
Und falls nochmals jemand die IP-Adresse eines falschen Googlebot braucht: bitte sehr 78.50.113.94

Verfasst: 01.08.2008, 11:34
von Holger Grintz
vielleicht bin ich ein bisschen blöd; aber diese Hansenet IP Adresse hat doch nichts mit einem falschen google-bot zu tun?
Ich kann doch mit jeder IP-Adresse als User-Agent einen bot eintragen, so wie es z.B. manche Sitemap-Generatoren machen.
Oder habe ich jetzt irgend etwas nicht verstanden??

Verfasst: 01.08.2008, 11:37
von Airport1
du hasts schon richtig verstanden. ein jeder kann mit seiner ip sich als gbot ausgeben. d.h. also nicht dass die ip - von mir aus lassen wir es die 78.50.113.94 sein - jetzt immer automatisch als gbot daher kaeme. das naechste mal koennte sie sich - weil dynamisch vergeben - schon als gewoehnlicher besucher mit firefox entpuppen..

Verfasst: 03.08.2008, 16:34
von wolli
muemmel_0811

schau dir mal die PHP Funktion gethostbyaddr an

nette Grüße
wolli

Verfasst: 04.08.2008, 07:58
von muemmel_0811
Hallo wolli,

Danke für den Tipp, allerdings arbeite ich in einem Anti-PHP-Unternehmen - PHP ist bei uns leider ein Schimpfwort :o - ich kann's auch nicht verstehen, ist aber so.
Ich hab mich mittlerweile des Java-Objekts InetAddress bedient - das liefert zumindest die gleichen Ergebnisse, wie die heise-whois-Abfrage und reicht mir damit völlig.

Danke nochmals.