eine kurze Bemerkung... Ich setze auf einer Website ein selbstgeschriebes Skript ein, dass über alle IFRAMEs iteriert und darauf achtet, ob die typischen AS-Bannergrössen auftauchen. Tun sie das nicht weiss mein Skript, dass der User einen Blocker verwendet und meldet das mittels eines AJAX-Requests (den mach ich mit JQuery) an ein PHP Skript, welches die IP loggt.
Nun, heute sehe ich in meinem Logfile:
02.05.2011 08.22:59 ADBL crawl-66-249-66-200.googlebot.com https://xxxxxx/
Das ist ein eindeutiger Beweis, dass der Googlebot offenbar auch nicht-triviale Javascripts perfekt ausführen kann, sonst hätte der AJAX-Request nicht geklappt und das Google somit auch per AJAX nachgeladene Inhalte "versteht" => Google versteht vermutl. alle trivialen Javascript-basierten Schummeltechniken auf Doorwaypages.
Interessant wäre es jetzt auszuprobieren, ob der Googlebot vielleicht nur JQuery "nachprogrammiert" drin hat oder ob er generell AJAX "versteht".
Wenn ein Browser JavaScript interpretieren und ausführen kann, warum sollte es dann ein Stück Software, welches HTML lesen, blackhat-Techniken identifizeren, Textstellen gewichten usw. kann, nicht können? Das hab ich noch nie verstanden. Dem Bot eine JS-Engine zu spendieren und ihm ein paar mehr Heuristiken zu verpassen - so what. Wir sind in 2011, nicht mehr in 1999....