Googles Toleranz bezüglich Doubletten bzw. ähnlichen Seiten
Verfasst: 06.03.2004, 11:30
Google erkennt bekanntermaßen ähnliche Seiten, und filtert nach irgendwelchen Spielregeln die Doubletten raus.
Gibt es hier jemanden, der zu dem Thema etwas weis? Insbesondere interessieren mich folgende Fragestellungen:
Gibt es hier jemanden, der zu dem Thema etwas weis? Insbesondere interessieren mich folgende Fragestellungen:
- Werden ähnliche Seiten zunächst einmal von Google in den Index aufgenommen, und eventuell in einem späteren Schritt mit vorhandenen Seiten verglichen und dann erst ausgefiltert, oder erkennt Google bereits beim Spidern ähnliche Seiten, und nimmt ähnliche Seiten dann garnicht erst in den Index auf?
- Werden ähnliche Seiten, die zu einer Domain gehören, eher als solche erkannt, als die gleichen ähnlichen Seiten, wenn sie auf verschiedenen Domains liegen?
- Ist es dazu noch von Bedeutung, ob die ähnlichen Seiten, die zu unterschiedlichen Domains gehören, physikalisch auch auf unterschiedlichem Webspace liegen?
- Werden Links, die von ähnlichen Seiten ausgehen, von Google trotzdem weiter verfolgt, auch wenn die Seiten selbst nicht im Index aufgenommen werden, oder rausgeflogen sind?
- Sind irgendwelche Kriterien bekannt, ab wann zwei Seiten von Google als Doubletten identifiziert werden, bzw. welche Unterschiede müssen vorhanden sein, damit Google zwei Seiten nicht als identisch ansieht?