Beitrag
von Margin » 21.12.2007, 08:43
Moin moin,
ich beobachte ähnliches und mir geistert da eine vage und unausgereifte Theorie im Kopf rum. Vielleicht mag ja jemand den Faden aufnehmen und weiterspinnen.
Zwei Ansatzpunkte:
1. Auflösung des Supplementals. (Fakt - googleseitig bestätigt)
2. Nichts ist älter als die Zeitung von gestern.
Durch die Auflösung des erweiterten Index entsteht, offensichtlich nur nach und nach, ein riesiger Hauptindex. In einigen Bereichen ist er schon seit "geraumer Weile" verschwunden, in anderen nach wie vor vorhanden. Der zusammengelegte Index muss nun irgendwie neu sortiert werden und alles in allem ist es wohl mit erheblichem Aufwand und enormem Kapazitätsbedarf verbunden. (Ich persönlich gehe davon aus, dass es auch mit einem einzigen Neu-Sortierungs-Durchlauf nicht getan ist, sondern dass etliche Durchläufe nötig sind.)
Auf der anderen Seite kommen täglich neue Infos, neue Seiten hinzu. Diese müssen ebenfalls erfasst werden, es könnten ja brandheiße wichtige News sein und die müssen ja bei Google zu finden sein, sonst wäre der Index veraltet, bis die Umstellung durch ist. Aber ein Bot ist nur ein Bot, er kann da grundsätzlich mal Äpfel und Birnen nicht unterscheiden, also nimmt er einfach erstmal alles mit. Wohin nun damit? In den Hauptindex, der gerade umgestellt wird? Geht nicht. Also lagern wir sie erstmal als "News" zwischen, bis die Umsortierung soweit durch ist, dass sie dort einfließen können. Und da "News" von Haus aus nur ein begrenztes Haltbarkeitsdatum haben, verschwinden sie nach ein paar Tagen wieder und schlummern irgendwo vor sich hin und warten.
Wie gesagt, nur eine Theorie, auch noch recht brüchig, aber vielleicht ein erster Ansatz. Frei nach dem Motto: Finden wir die Ursache, liegt die Lösung vor der Tür. Vielleicht hat ja auch jemand eine völlig andere Theorie?
Gruß Margin