Seite 1 von 1

Googlebot spidert kodierte mailto-Links ...

Verfasst: 23.02.2005, 13:28
von robo
Hi Leute,

um E-Mail Harvester auszutricksen (bei vielen klappt es), habe ich die Mailadressen und mailto-Links mit HTML-Entities kodiert, z. B. so:
<a href="&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#119;&#101;&#98;...

Nun scheint der Googlebot dies zu seit neuestem dekodieren und prüft anschliessend offensichtlich nicht mehr, ob es sich um einen mailto-Link handelt und versucht, diesen anzufordern:

66.249.66.163 - - [20/Feb/2005:16:35:43 +0100] "GET /mailto:webmaster@... HTTP/1.1" 404 2130 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +https://www.google.com/bot.html)"
66.249.71.39 - - [23/Feb/2005:09:19:31 +0100] "GET /mailto:webmaster@... HTTP/1.0" 404 2118 "-" "Googlebot/2.1 (+https://www.google.com/bot.html)"

Hat jemand etwas Ähnliches beobachtet?

Ich betrachte dies als Bug im Googlebot. Bringt es was, Google diesen Bug zu melden und wenn ja, an welche Adresse?

cu, Robo :)

Verfasst:
von

Googlebot spidert kodierte mailto-Links ...

Verfasst: 02.03.2005, 11:47
von robo
Ich habe mich dann doch entschlossen, das über irgend so ein Kontaktformular auf google.com Google mitzuteilen, und heute kam die Antwort:
Google hat geschrieben:Thank you for your note. We appreciate your bringing this to our
attention, and we'll investigate.

Regards,
The Google Team
cu, Robo :)