Seite 1 von 2

Datenprobleme bei Google

Verfasst: 30.10.2005, 09:28
von buttheads
Fernab von den ganzen Diskussionen um "updates", "upgrades" und wie es alles genannt wird: Google hat derzeit üble Datenbestandsprobleme.

Ich verstehe schon nicht mehr, woher die die uralt Daten überhaupt noch nehmen, die plötzlich wieder auftauchen. Ich habe haufenweise Seiten gefunden, die ich nicht nur einmal sondern bereits zweimal per URL-Konsole gelöscht habe. 404s liegen sowieso drauf ... und das nochmal extra mit noindex,nofollow versehen. Und trotzdem tauchen die wieder auf - ich kriege sogar nen alert für die Site: Abfrage.

Hat irgendjemand herausgefunden, welchen Sinn das für google macht, uralt Daten hervorzukramen und die nicht löschbar zu machen? Oder haben die ihre eigene Datenverwaltung nicht mehr im Griff?

Für mich siehts nach zwei Dingen aus:
1. Google vergisst nichts - und will auch nichts vergessen. Oder die kriegen es nicht auf die Reihe, Ihren Datenbestand sauber zu halten.
2. Die URL-Konsole kann man getrost in die Tonne kloppen.

Verfasst:
von

Hochwertiger Linkaufbau bei ABAKUS:
  • Google-konformer Linkaufbau
  • nachhaltiges Ranking
  • Linkbuilding Angebote zu fairen Preisen
  • internationale Backlinks
Wir bieten Beratung und Umsetzung.
Jetzt anfragen: 0511 / 300325-0

Datenprobleme bei Google

Verfasst: 30.10.2005, 09:35
von ArturO
Ich glaube die holen für Jagger nochmal alle Seiten aus dem Zauberkästchen. Durch diese Verwaisten Seiten füllt sich der index ein bissl.
Man will schließlich noch mit Yahoo konkurieren können. Kann mir gut vorstellen, dass die dadruch ziemlich angepisst sind =(. Deshalb wird der aktuelle Index-Stand auch nimmer auf der Hauptseite angezeigt.

Datenprobleme bei Google

Verfasst: 30.10.2005, 09:41
von buttheads
Ich glaube die holen für Jagger nochmal alle Seiten aus dem Zauberkästchen.
Ich glaube, das die ganzer "Jagger-update" Diskussion eine Pseudo-Diskussion ist, die gemacht wird, um die Datenverwaltungsprobleme bei Google zu kaschieren. Es kann für die google-jungs nicht wirtschaftlich sein, die ganzen uralt Daten verwalten zu müssen.

Verfasst:
von

Re: Datenprobleme bei Google

Verfasst: 30.10.2005, 10:32
von patrol
buttheads hat geschrieben:...

Hat irgendjemand herausgefunden, welchen Sinn das für google macht, uralt Daten hervorzukramen und die nicht löschbar zu machen? Oder haben die ihre eigene Datenverwaltung nicht mehr im Griff?

Für mich siehts nach zwei Dingen aus:
1. Google vergisst nichts - und will auch nichts vergessen. Oder die kriegen es nicht auf die Reihe, Ihren Datenbestand sauber zu halten.
2. Die URL-Konsole kann man getrost in die Tonne kloppen.
1. Google speichert doch die Historie eines Auftrittes.
2. Warum, stört doch keinen...

Verfasst: 30.10.2005, 10:41
von Steffi
Na endlich mal ne sinnvolle Diskussion um vermeindliche Updates :-)

Bei mir sind auch uralt Seiten aufgetaucht, momentan mit einem Cache von 02/2005 und Seiten die auch schon mal mit der Console von mir gelöscht wurden.

Das Ding an der Sache ist, genau in diesem Zeitraum Februar/März 2005 "hing" der Spider irgendwie teilweise, Seiten wurden bei mir nicht eingelesen oder sogar andere Seiten (etwa 10.000) wurden gespidert und kamen aber nicht in den Index.

Plötzlich, über 6 Monate später tauchen die Seiten aber auf. :idea:

Ich denke auch, es war eher ein Problem als ein echtes Update.
Mir kommt es so vor, als würden von Zeit zu Zeit alte Datenbanken mit reingeschoben werden aus Angst Daten zu verlieren.

Es ist doch schon fast eindeutig, Spam wird bekämpft, aber Google erkennt es anscheinend nicht das Seiten seit über einem Jahr nicht mehr erreichbar sind??? Da ist was faul...

Datenprobleme bei Google

Verfasst: 30.10.2005, 10:53
von Pompom
Google erstellt nicht zum Zeitpunkt X einen vollständig neuen index, sondern der neue Index wird aus dem Altbestand + Änderungen + Neubestand erzeugt.
Dabei empfinde ich es als ganz normal, dass alte Seiten auftauchen und verschwinden und die Daten zeitweise sehr inkohärent wirken.

Das Organisieren von Datenbeständen in der Größenordnung und über x Rechenzentren ist nicht mehr ein triviales Problem.

Oder haben die ihre eigene Datenverwaltung nicht mehr im Griff?

Die haben sogar ihre Datenverwaltung so gut im Griff, dass sie pro Tag ca. 200 Millionen Suchanfragen beantworten, dabei noch ein Datenupdate fahren, noch das Suchprofil jedes Nutzers speichern und sich noch im Rahmen Adwords/Adsense um relevante Ads kümmern 0X

Datenprobleme bei Google

Verfasst: 30.10.2005, 11:42
von fredde
ja, was google an datenmengen umwälzt und bewerkstelligt, ist unvorstellbar.

zur url-konsole: die konsole löscht die dateien nicht wirklich, sondern nur den output in den serps. das für 6 monate. die daten tauchen danach oft als "zusätzliches ergebnis" auf. intern bleiben alle daten gespeichert. "löschen" per konsole ist ein trugschluss. dass es nun derartige probleme gibt, ist m.E. ein hinweis auf die menge an daten, die im rahmen des updates umgewälzt werden, wie pompom auch schon sagte.

Datenprobleme bei Google

Verfasst: 30.10.2005, 11:44
von buttheads
@pompom
Recht hast Du wenns um die Suchabwicklung geht. Falsch liegst Du mit dem "im Griff haben" wenn es darum geht, "alte" Daten im Bestand zu haben. Die müssen schließlich mitverwaltet werden. Es deutet auf etwas Faules hin, wenn pages mit letztem Spider-Datum Februar 2004 (habe sogar welche aus 2003 gefunden) plötzlich wieder auftauchen - und das nachdem sie schon mehrfach mit der Konsole gelöscht worden sind.

Datenprobleme bei Google

Verfasst: 30.10.2005, 12:50
von The-Plaqe
wobei bei mir uralt daten zum teil vom mai 2003 sogar mit hervorgekramt wurden diese seiten exisitieren schon seit anfang 2004 nicht mehr (vor diesem jagger zeugs war von denen auch keine einzige im index drinne).

Verfasst: 30.10.2005, 12:55
von Steffi
Es ist doch bekannt, daß bei diversen Updates in den letzten Monaten zu stark ausgesiebt wurde. Nicht nur Spam, sondern auch gute Projekte wurden gekickt. Dies will man nun rückgängig machen...

Und was macht man da? Alte Datenbanken wieder mit reinspielen.... :D

Datenprobleme bei Google

Verfasst: 30.10.2005, 13:00
von Pretender
buttheads hat geschrieben: Google hat derzeit üble Datenbestandsprobleme.
Hast Du diese Info direkt von Google oder ist das eine Vermutung?

Soweit ich das beurteilen kann, zeigt Google schon seit über einem Jahr Seiten an die es schon ewig nicht mehr gibt. Also sollte dann Google wohl (nach Deiner Aussage) schon seit geraumer Zeit Datenbestandsprobleme haben?

Datenprobleme bei Google

Verfasst: 30.10.2005, 14:57
von Pompom
Es deutet auf etwas Faules hin, wenn pages mit letztem Spider-Datum Februar 2004 (habe sogar welche aus 2003 gefunden) plötzlich wieder auftauchen
Das ist ja nun oberquatsch.
Das, was du siehst, ist das Datum, mit dem dir Google sagt:
Der Cache stammt von diesem Datum.
Woher willst du wissen, daß die Seiten seit dem nicht mehr gespidert wurden ?

Viele meiner Seiten werden öfter gespidert, als der Cache aktualisiert wird.
- und das nachdem sie schon mehrfach mit der Konsole gelöscht worden sind.
Ich glaube auf keinen Fall, daß dir Google das Recht gibt, mit der Konsole irgendwelche Seiten in ihrem Datenbestand zu löschen. Maximal räumen sie dir das Recht ein, festzulegen, daß die Seiten für eine definierte Zeit nicht aus dem Google-Datenbestand angezeigt werden. Sind die Seiten trotzdem noch da, tauchen sie auch wieder auf. Besonders, wenn immer noch irgendwelche Links auf diese Seiten gesetzt sind.

Für die, die nicht nur Sprüche absondern wollen, sondern auch versuchen, die Problematiken eines Updates zu verstehen, sei dieses schon etwas in die Tage gekommene Dokument empfohlen. Besonders 4.1 Google Architecture Overview

https://www-db.stanford.edu/~backrub/google.html

Verfasst: 30.10.2005, 15:05
von Steffi
@Pompom

na geht´s noch?
Woher willst du wissen, daß die Seiten seit dem nicht mehr gespidert wurden ?
WEIL DIE SEITEN NICHT MEHR AUF DEM SERVER SIND!! :bad-words:

Datenprobleme bei Google

Verfasst: 30.10.2005, 17:09
von Pompom
DAS ist natürlich ein Argument :P

Verfasst: 30.10.2005, 18:08
von Cbn5
Ich habe Ende 2004 durch einen Fehler viel Dublicate Content über Subdomains erzeugt: domain/seite.htm, test.domain/seite.htm, test1.domain/seite.htm etc. waren im Index. Also habe ich am 14.01.2005 für die Subdomains einen eigenen vHost angelegt, der seitdem für alle Anfragen an subdomain.domain nur noch eine "Diese Seite ist Umgezogen" anzeigt (keine Weiterleitung, nur dieser Plain-Text). Dennoch zeigt Google heute, 10 Monate nachdem die Seiten entfernt wurden, immernoch den Dublicate Content an. Ich möchte die Subdomains aber nicht über die Konsole löschen, weil ich sie evtl. später nocheinmal brauche, aber es kann doch nicht sein das Goolge immernoch diese Seiten (sogar mit Textvorschau und Cache!) im Index hat obwohl diese defakto seit 10 Monaten gar nicht mehr existieren.