Nach meinem Wissensstand ist die Meinung verbreitet, dass Googlebot und Konsorten sich nicht für CSS und JS interessieren. Da habe ich das Argument im Ohr: "Warum sollte das Google tun!? Das kostet viel zu viel Rechenleistung."
Bei Yahoo habe ich es in den letzten Wochen schon mehrfach gesehen, dass der Bot "Slurp" auch JS und CSS Dateien ausliest. Und dies auch mit Referer. Eigentlich hielt ich das schon für normal und zumindest nicht erwähnenswert, da Yahoo für SEO nur eine untergeordnete Rolle spielt.
Hier ein Beispiel:
Code: Alles auswählen
72.30.142.106 - - [24/Apr/2009:00:40:05 +0200] "GET /tag/xxx HTTP/1.0" 200 32821 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)"
72.30.142.106 - - [24/Apr/2009:00:40:11 +0200] "GET /wp-content/plugins/social_bookmarks/lib/niftyCube/niftyCorners.css HTTP/1.0" 304 - "http://www.xxx.com/tag/xxx" "Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)"
72.30.142.106 - - [24/Apr/2009:00:40:16 +0200] "GET /wp-content/plugins/wp-email/email-css.css?ver=2.40 HTTP/1.0" 304 - "http://www.xxx.com/tag/xxx" "Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)"
72.30.142.106 - - [24/Apr/2009:00:40:18 +0200] "GET /wp-content/themes/xxx.com/pagenavi-css.css HTTP/1.0" 304 - "http://www.xxx.com/tag/xxx" "Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)"
72.30.142.106 - - [24/Apr/2009:00:40:20 +0200] "GET /styles/style.css HTTP/1.0" 304 - "http://www.xxx.com/tag/xxx" "Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)"
72.30.142.106 - - [24/Apr/2009:00:40:23 +0200] "GET /styles/jd.gallery.css HTTP/1.0" 304 - "http://www.xxx.com/tag/xxx" "Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)"
Auch hier ein Beispiel:
Code: Alles auswählen
66.249.73.72 - - [24/Apr/2009:11:25:16 +0200] "GET /robots.txt HTTP/1.1" 200 24 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.73.72 - - [24/Apr/2009:11:25:17 +0200] "GET /wp-content/plugins/wp-pagenavi/pagenavi-css.css HTTP/1.1" 200 1753 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.73.72 - - [24/Apr/2009:11:25:18 +0200] "GET /wp-content/themes/xxx.info/js/effects.core.js HTTP/1.1" 200 19170 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.73.72 - - [24/Apr/2009:11:25:18 +0200] "GET /wp-content/themes/xxx.info/style.css HTTP/1.1" 200 31627 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.73.72 - - [24/Apr/2009:11:26:41 +0200] "GET /wp-content/themes/xxx.info/js/jquery-latest.js HTTP/1.1" 200 117302 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.73.72 - - [24/Apr/2009:11:26:42 +0200] "GET /wp-content/themes/xxx.info/js/functions.js HTTP/1.1" 200 619 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
Hier der Logfileauszug:
Code: Alles auswählen
66.249.73.72 - - [22/Apr/2009:13:25:48 +0200] "GET /pzolqijdcvbepvcd.html HTTP/1.1" 404 25469 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
Die Logfileauszüge (Googlebot) sind von einer Domain, die ich vor knapp einem Jahr registriert, aber erst vor 4 Tagen mit Content bestückt habe. Bis vor 4 Tagen lief die Domain noch auf einer anderen IP mit einer Fehlerseite (403). Nachdem ich den Content eingestellt hatte, habe ich einmal einen Ping abgesetzt und hab bis heute nichts verändert. Erst heute habe ich ein paar Links gesetzt.
Der Logfileauszug ganz oben (Yahoo) ist von einer etwa 4 Jahre alten Domain.
Warum tut Google das? Was für ein Interesse hat Google an den CSS und JS Dateien?
Wenn Google die Files im Kontext der Seite auswerten könnte/kann, dann ist Google wohl in der Lage schmutzige Tricks zu erkennen, und die Seite abzustrafen oder zu filtern. Es wäre dann aber auch möglich, dass Goolge auch "legale" dynamische Elemente auf der Seite erkennt, und diese dann entsprechend bewertet. Z.B. ein ausklappbares Menü wovon zwar alle Links im HTML Code eingebettet sind, aber nur die erste Ebene auch sichtbar ist.
Ich sehe das jetzt nicht als Beweis, dass Google diese Geschichten voll auswertet, um spammige Methoden zu erkennen, aber ich denke es geht in diese Richtung. Oder was meint Ihr?
Sonnige Grüsse
HaPe