Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Googlebot liest CSS und JS

Alles zum Thema: Robots, Spider, Logfile-Auswertung und Reports
t-rex
PostRank 7
PostRank 7
Beiträge: 585
Registriert: 15.03.2004, 14:00

Beitrag von t-rex » 24.04.2009, 12:25

Hi,

Nach meinem Wissensstand ist die Meinung verbreitet, dass Googlebot und Konsorten sich nicht für CSS und JS interessieren. Da habe ich das Argument im Ohr: "Warum sollte das Google tun!? Das kostet viel zu viel Rechenleistung."

Bei Yahoo habe ich es in den letzten Wochen schon mehrfach gesehen, dass der Bot "Slurp" auch JS und CSS Dateien ausliest. Und dies auch mit Referer. Eigentlich hielt ich das schon für normal und zumindest nicht erwähnenswert, da Yahoo für SEO nur eine untergeordnete Rolle spielt.

Hier ein Beispiel:

Code: Alles auswählen

72.30.142.106 - - [24/Apr/2009:00:40:05 +0200] "GET /tag/xxx HTTP/1.0" 200 32821 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)"
72.30.142.106 - - [24/Apr/2009:00:40:11 +0200] "GET /wp-content/plugins/social_bookmarks/lib/niftyCube/niftyCorners.css HTTP/1.0" 304 - "http://www.xxx.com/tag/xxx" "Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)"
72.30.142.106 - - [24/Apr/2009:00:40:16 +0200] "GET /wp-content/plugins/wp-email/email-css.css?ver=2.40 HTTP/1.0" 304 - "http://www.xxx.com/tag/xxx" "Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)"
72.30.142.106 - - [24/Apr/2009:00:40:18 +0200] "GET /wp-content/themes/xxx.com/pagenavi-css.css HTTP/1.0" 304 - "http://www.xxx.com/tag/xxx" "Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)"
72.30.142.106 - - [24/Apr/2009:00:40:20 +0200] "GET /styles/style.css HTTP/1.0" 304 - "http://www.xxx.com/tag/xxx" "Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)"
72.30.142.106 - - [24/Apr/2009:00:40:23 +0200] "GET /styles/jd.gallery.css HTTP/1.0" 304 - "http://www.xxx.com/tag/xxx" "Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)"
Heute dann habe ich zum ersten mal gesehen, dass auch der Googlebot sich für JS und CSS interessiert.

Auch hier ein Beispiel:

Code: Alles auswählen

66.249.73.72 - - [24/Apr/2009:11:25:16 +0200] "GET /robots.txt HTTP/1.1" 200 24 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.73.72 - - [24/Apr/2009:11:25:17 +0200] "GET /wp-content/plugins/wp-pagenavi/pagenavi-css.css HTTP/1.1" 200 1753 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.73.72 - - [24/Apr/2009:11:25:18 +0200] "GET /wp-content/themes/xxx.info/js/effects.core.js HTTP/1.1" 200 19170 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.73.72 - - [24/Apr/2009:11:25:18 +0200] "GET /wp-content/themes/xxx.info/style.css HTTP/1.1" 200 31627 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.73.72 - - [24/Apr/2009:11:26:41 +0200] "GET /wp-content/themes/xxx.info/js/jquery-latest.js HTTP/1.1" 200 117302 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.73.72 - - [24/Apr/2009:11:26:42 +0200] "GET /wp-content/themes/xxx.info/js/functions.js HTTP/1.1" 200 619 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
Nebenbei fiel mir noch auf, dass der Googlebot, obwohl ich diese Seite nirgends verifizieren lies. Also nirgends in den Webmastertools, Adsense, Adwords oder sonst wo eingetragen habe, einen 404 Check macht.

Hier der Logfileauszug:

Code: Alles auswählen

66.249.73.72 - - [22/Apr/2009:13:25:48 +0200] "GET /pzolqijdcvbepvcd.html HTTP/1.1" 404 25469 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
Ich habe jetzt stichprobenmässig einige Logfiles von über 100 Domains der letzten 2 Jahre durch gearbeitet. Ich finde da zwar Einträge in Verbindung mit CSS/JS von Yahoo, aber keine solche Einträge vom Googlebot.

Die Logfileauszüge (Googlebot) sind von einer Domain, die ich vor knapp einem Jahr registriert, aber erst vor 4 Tagen mit Content bestückt habe. Bis vor 4 Tagen lief die Domain noch auf einer anderen IP mit einer Fehlerseite (403). Nachdem ich den Content eingestellt hatte, habe ich einmal einen Ping abgesetzt und hab bis heute nichts verändert. Erst heute habe ich ein paar Links gesetzt.

Der Logfileauszug ganz oben (Yahoo) ist von einer etwa 4 Jahre alten Domain.

Warum tut Google das? Was für ein Interesse hat Google an den CSS und JS Dateien?
Wenn Google die Files im Kontext der Seite auswerten könnte/kann, dann ist Google wohl in der Lage schmutzige Tricks zu erkennen, und die Seite abzustrafen oder zu filtern. Es wäre dann aber auch möglich, dass Goolge auch "legale" dynamische Elemente auf der Seite erkennt, und diese dann entsprechend bewertet. Z.B. ein ausklappbares Menü wovon zwar alle Links im HTML Code eingebettet sind, aber nur die erste Ebene auch sichtbar ist.

Ich sehe das jetzt nicht als Beweis, dass Google diese Geschichten voll auswertet, um spammige Methoden zu erkennen, aber ich denke es geht in diese Richtung. Oder was meint Ihr?

Sonnige Grüsse
HaPe
Keiner weiss wass ich tue, aber alle wissen wie ich es besser machen kann
save the bookmark - logocreatr - backgrounds - templatr- PPC Themes