ich habe folgende Beobachtung gemacht und hätte gerne mal ein paar Spekulationen dazu:
Umgebung:
.de Domain; mehrere Jahre alt; nicht sonderlich optimiert; 100k+ Seiten; 100k+ Pis/d
jetzt habe ich für sehr wenige Seiten festgestellt, dass der googlebot diese
* genau alle 60 Minuten abruft und
* das seit Monaten, jede Stunde, ohne Pause,
* keine Änderung des Intervalls,
* kein Wechseln der Seiten obwohl es tausende ähnlicher Seiten gibt,
* Content auf den Seiten ist konstant,
* nur einige wechselnde Content-Elemente (wie News-Teaser o.ä)
also nur mal so ein Ausschnitt wie konstant das aussieht ... wie gesagt die selbe Url wird auch heute noch in diesem Intervall gecrawlt:
Code: Alles auswählen
2009-01-12 04:01:49 66.249.72.11 HTTP/1.1 200 "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
2009-01-12 05:01:25 66.249.72.11 HTTP/1.1 200 "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
2009-01-12 06:00:49 66.249.72.11 HTTP/1.1 200 "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
2009-01-12 07:02:01 66.249.72.11 HTTP/1.1 200 "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
2009-01-12 08:01:21 66.249.72.11 HTTP/1.1 200 "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
2009-01-12 09:00:54 66.249.72.11 HTTP/1.1 200 "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
2009-01-12 10:00:31 66.249.72.11 HTTP/1.1 200 "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
2009-01-12 11:00:32 66.249.72.11 HTTP/1.1 200 "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
2009-01-12 12:00:37 66.249.72.11 HTTP/1.1 200 "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
2009-01-12 13:01:34 66.249.72.11 HTTP/1.1 200 "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
2009-01-12 14:01:29 66.249.72.11 HTTP/1.1 200 "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
2009-01-12 15:01:51 66.249.72.11 HTTP/1.1 200 "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
ich habe eigentlich nur 2 Ideen:
- google hat festgestellt, dass diese Seiten ihren content nicht mehr ändern (im Gegensatz zu vielen anderen Seiten) und nimmt diese um die dynamischen Content-Elemente zu beobachten, also: "alles was sich auf dieser Seite noch ändert, brauchen wir woanders nicht beachten"
- oder wir werden irgendwann von "Google/SitePerformance" überrascht und können uns dort die Performance-Daten (Ladezeiten) für die letzten Jahre ansehen, also "ein performance tracking"
und was meint Ihr?
weitere Ideen oder jemand mit ähnlichen Beobachtungen ?