Seite 1 von 1

Duplicate Content

Verfasst: 03.01.2006, 09:38
von alexxx
Hallöchen,

ich habe mich gerade gefragt wie eine Seite bei G** so weit vorn gelsitet werden kann obwohl sie fast ausschliesslich doppelte Seiten hat.
ABer G** hat diese Seite 47.000 mal im Index ????

herzfusion.de <-- ist doch alles immer das selbe????

Ab wann handelt es sich denn eigentlich um DC? Vielleicht kann mich ja mal jmd aufklären über DC natürlich :)

Grüsse

Verfasst:
von

DC

Verfasst: 04.01.2006, 00:13
von rallyeulli
Das würde ich auch gerne mal wissen.
also bitte kann uns einer der experten mal aufklären
danke

Verfasst: 04.01.2006, 09:57
von Martin Ice
Guten Morgen,

ich bin kein Experte möchte aber trotzdem was dazu sagen. IMO wird DC nur bei wirklich doppelten Seiten erkannt und auch so eingestuft. Ist zum Beispiel eine Artikelbeschreibung auf einer Übersichtseite genau der gleiche/selbe? wie der auf der Detailseite des Artikels, wird die Detailseite nicht als DC eingestuft.
Allerdings kann über einen Hashwert der Seite schnell und einfach auf DC geschlossen werden. Irgendeiner hat mal was von ca. 80% gleichen Inhalt erzählt. Obs stimmt, keine Ahnung.
Zusätzlich soll g* und macht es auch die Ips vergleichen und die DENIC Daten zu Rate ziehen.

Schliesslich und endlich gibts ja noch den Algo, da kann eine kleine Änderung schon den DC Filter für eine Seite schnell mal einschalten.

Nun noch meine IMHO:
Bei den Milliarden Seiten im Internet und dem intensiven Rechenaufwand denke ich, dass DC eher bei wirklich 100% gleichen Seiten anfängt. Denn was ist, wenn g* DC erkennt aber es sind wirklich zwei unterschiedliche Firmen, die nur den gleichen Text aus einer Beschreibung kopiert haben? Wenn will man abstrafen.