Seite 1 von 1

Double content kommt nicht in den index höre ich hier immer?

Verfasst: 05.09.2010, 20:57
von bodomalo
Immer wieder lese ich hier dass google DC abstraft, oder die entsprechenden Seiten nicht in den Index aufnimmt.

Nun gucken wir mal:
https://www.google.at/#hl=de&q=%22Gleic ... 6381f52307

Der selbe Satz kommt in allen Meldungen vor, denn die Texte sind absolut gleich. Meist nur etwas anders formatiert oder mit anderen URL Tags.

Wieso nimmt google den exakt gleichen Text so oft auf?

1 mal
https://www.nachrichten.ch/detail/451495.htm
2 mal
https://www.news.ch/Hollywood+Star+Doug ... detail.htm
3 mal
https://www.tt.com/csp/cms/sites/tt/%C3 ... krankt.csp
4 mal
https://de.news.yahoo.com/26/20100817/t ... 9b785.html

usw. usw...

Nunja, warum ich für keine Zeitung der Welt Geld zahlen würde ist sowieso klar, aber warum gilt hier die MEinung dass DC etwas schlimmes wäre? Google scheint es zu lieben.

Verfasst:
von

Verfasst: 05.09.2010, 21:27
von catcat
Dann mach das mal auf Deiner eigenen Site und schau zu, ob google Dich dann immer noch lieb hat^^

Darüber, das google DC nicht gern hat, braucht man eigentlich gar nicht reden. Das ist einfach so. Nur, weil einige "grosse" Sites das dürfen, darfst Du (und ich) das noch lange nicht.

Re: Double content kommt nicht in den index höre ich hier im

Verfasst: 05.09.2010, 22:00
von Alda
bodomalo hat geschrieben: Wieso nimmt google den exakt gleichen Text so oft auf?
Da fragst Du besser bei Google an.

Oder Du machst einfach eine Site mit der Reputation von Stern, Welt oder sonstwas in der Richtung. :D

Verfasst:
von
SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


Verfasst: 06.09.2010, 02:59
von suchus
Naja hier handelt es sich doch um Zitate die sollte man dann auch so wiedergeben wie sie gesagt wurden. Solche Meldungen kommen aus dem Ticker da wird nicht mehr viel dran rumgespielt.

Demnächst kannste ja alle Zeitungen verbieten die DPA Meldungen in ihren Seiten drinhaben dann gibt es in D nur noch eine Zeitung oder vielleicht zwei wenn man denn Bild ne Zeitung nennen will :D

Re: Double content kommt nicht in den index höre ich hier im

Verfasst: 06.09.2010, 07:17
von 800XE
bodomalo hat geschrieben:Wieso nimmt google den exakt gleichen Text so oft auf?
sooooooooooo oft? ..... 7 Ergebnisse (0,32 Sekunden)

suchen wir mal etwas "normaler"
https://www.google.de/search?q=Medizine ... ng+Douglas
= 72.300 Ergebnisse (0,21 Sekunden)
catcat hat geschrieben:das google DC nicht gern hat, braucht man eigentlich gar nicht reden.

Nur, weil einige "grosse" Sites das dürfen, darfst Du (und ich) das noch lange nicht.
dürfen die das?
oder hat G noch nicht gemerkt das?
warum sind bei meiner Suche die Ergebnisse so anders .... vielleicht weil die DCs schon "abgestraft" sind?
bodomalo hat geschrieben:Wieso nimmt google den exakt gleichen Text so oft auf?
sooooooooooo oft? ..... 7 Ergebnisse (0,32 Sekunden)

Wenn Du eine Sekrätärin wärest und einen Brief bekommst ....
... wird der dann abgeheftet oder prüfst Du erstmal (sehr gründlich) ob der Brief vielleicht schon abgeheftet ist

7 Ergebnisse (0,32 Sekunden)

wie lange braucht Google um eine Seite zu spidern und abzulegen?
Ich habe glaub Server zu Server mal mit einem Speed von 250 oder 350 Mega pro Minute kopiert
300 Mega pro Minute = 5 Mega pro Sekunde

eine Seite hat vielleicht 100 Kilo = 0.1 Mega an html
eine Seite lesen braucht eine 50tel Sekunde 1 / 50 = 0.02 Sekunden + die Zeit wo der Server braucht die Seite aufzuarbeiten von z.B. 0.08 .... aber Google wird sicherlich in mehrere Threads Seiten einlesen und wärend der Wartezeit wird keine CPU verbraucht

7 Ergebnisse (0,32 Sekunden)

es werden also 0.02 Sekunden CPUtime verbraucht um zu lesen und die Festplatte zu schreiben
und wieviel CPUtime wird verbraucht um jetzt alle Sätze zu entnehmen und zu prüfen ob die schon auf Anderen Seiten vorhanden sind

7 Ergebnisse (0,32 Sekunden)

Bei 10 Sätzen wären das 3 Sekunden ... vielleicht nur 2 Sekunden ....

Google braucht zum lesen 0.02 Sekunden + 2 Sekunden für die Prüfung
Der CPUverbraucht ver100facht sich ....
.... Google hat viele Computer und auch viel Geld um sich die zu leisten
Die haben aber sicher nicht 100mal soviele wie nötig ....
.... hier und da mal eine Stichprobe, wenn die Alarm schlägt genauer prüfen

und auch wenn DC gefunden wurde
(a) Datei löschen und beim nächsten mal wieder spidern und wieder prüfen und wieder löschen
(b) Datei lassen wo sie ist und das "ranking" absenken (siehe auch meine Suche)

(b2) Wer es (das genaue, den DC) sucht, darf es auch finden

Verfasst: 06.09.2010, 08:41
von Dauerstress
800XE hats schon gesagt, Google muss DC erst mal erkennen. Darüber hinaus ist ja noch weiterer Text auf den Seiten. Wie das dann gewertet wird, steht in den Sternen. Im schlimmsten Fall kommen sehr ähnliche Seiten nicht in den Index. Häufiger ist aber, dass sie nicht ranken. Es kommt aber auch vor, dass überhaupt keine Probleme festzustellen sind.

Verfasst: 06.09.2010, 10:10
von HaraldHil
Wenn das Zitat weniger als 50 % des (Text-)Contents einer URL ist, wird das von Google nicht als DC gewertet.