Seite 1 von 1

Wie ähnlich dürfen Webseiten sein? Wie errechne ich das?

Verfasst: 11.06.2009, 08:40
von Onkel Claus
Hallo zusammen,

ich möchte bei einem Projekt mehrere Seiten (ca. 1.000) jeweils paarweise
miteinander vergleichen. Dabei will ich feststellen, wie ähnlich sie sich sind.
Da der Betreiber seine Seiten nur jeweils minimal variiert will ich ihm zeigen,
dass sein Content vermutlich nicht optimal ist.

Gibt es ein Tool, in das ich zwei URLs eigeben kann und das mir dann sagt,
dass sich die Seiten zu X% gleichen?

Und überhaupt: Wie viel Ähnlichkeit ist noch erlaubt, um von Google nicht
als Spam oder DC oder eben unsauber angesehen zu werden?


Danke für eure Tipps!
Der Onkel

Verfasst:
von

Verfasst: 11.06.2009, 09:57
von propaganda
Ja, sowas gibt es zuhauf.
Bei den meisten kannst Du allerdings immer nur genau zwei Seiten miteinander vergleichen.
Das ist natürlich sehr zeitintensiv.
Das ist so ein Tool.
Um Unterseiten einer Domain vollautomatisch miteinander zu vergleichen, nutze ich einen Spider.
Der bringt Dir aber in Deinem speziellen Fall wahrscheinlich wenig.

Verfasst: 11.06.2009, 10:02
von MrTunes
Zwei Dinge auf Ähnlichkeit zu prüfen ist schwieriger als es sich anhört. Die meisten solcher Tools geben wahrschienlich in vielen Fällen einen einigermaßen guten Anhaltswert, mehr aber nicht.
Du kannst Dir mal das Patent "Detecting duplicate Content" (oder so ähnlich) anschauen um einen Eindruck zu bekommen wie komplex das Thema ist.

Verfasst:
von
Content Erstellung von ABAKUS Internet Marketing
Ihre Vorteile:
  • einzigartige Texte
  • suchmaschinenoptimierte Inhalte
  • eine sinnvolle Content-Strategie
  • Beratung und Umsetzung
Jetzt anfragen: 0511 / 300325-0

Verfasst: 11.06.2009, 10:05
von Margin
Wo genau nun die SuMas sagen, das ist DC, weiß kein Mensch, aber Tools gibt's dafür, wie bereits erwähnt, wie Sand am Meer. Noch eins: https://www.copyscape.com/

Re: Wie ähnlich dürfen Webseiten sein? Wie errechne ich das?

Verfasst: 11.06.2009, 10:05
von propaganda
Onkel Claus hat geschrieben:
Und überhaupt: Wie viel Ähnlichkeit ist noch erlaubt, um von Google nicht
als Spam oder DC oder eben unsauber angesehen zu werden?
Das kann Dir hier niemand genau sagen.
Je weniger Übereinstimmung, desto besser. Logisch.
Bei einer Übereinstimmung von 2/3, also unter 70%, würde ich mir allerdings noch keinen Kopf machen.

Verfasst: 11.06.2009, 10:08
von Onkel Claus
Hallo propaganda,


doch genau so etwas suche ich:
Ein Tool, das die Unterseiten EINER Domain automatisch vergleicht, wär optimal. https://www.abakus-internet-marketing.d ... ecrazy.gif

Was mich aber eben auch noch interessiert ist die Frage, zu wie viel Prozent
sich zwei Seiten ähnlich sein dürfen. Sind das 5% (vermutlich nicht) oder 99,9% ... ?

Verfasst: 11.06.2009, 10:09
von Onkel Claus
Vielen Dank erstmal!

Also ich hab mal zwei Seiten mit dem angegebenen Tool verglichen:
Es waren 78% Gleichheit.

Tja, was sagt mir das jetzt?

Verfasst: 11.06.2009, 10:13
von propaganda
Meinen Crawler rücke ich nicht so gerne raus.
Kannst es ja mal hiermit probieren:
https://www.duplicatecheck.com/

Verfasst: 12.06.2009, 09:14
von Liverson
Hier ein sehr gutes und kostenloses Tool, das generell das Web auf den zu überprüfenden Text spidert.
https://www.textbroker.de/uncover/