DC gibts einmal durch "leicht veränderte" Textbestandteile auf der eignen Seite (Seiten innerhalb der Domain unterscheiden sich nicht erheblich)
Für den Bereich "DC" im head haben wir seit einigen Monaten die Situation, das gleicher title und Description zu dieser "Hilfe, meine Seiten werden nur noch als URLs angezeigt"-Nummer führen.
Das Gleiche kann nach meiner Erfahrung bei Seiten passieren die sich nur unerheblich voneinander unterscheiden (paar mal keyword ausgetauscht), keinen eigenen Inhalt nach Abzug von Navigation und (Affili)-links haben. Dies scheint zu passieren nachdem der Mozilla Bot da war.
Ähnliches habe ich bei eigenen Navigationsseiten beobachtet, deren Content ausschließlich aus Sniptes von den Seiten bestand, für die sie teasen sollten - auch solche Seiten hatten (haben) aktuell keinen Bestand im Google-index ... was echt ein Problem bei internen verlinkungen sein kann. Nach starker Verkleinerung der Snipets hat sich das allerdings gebessert. (Ich habe noch keine konkreten Zeichen oder Prozentangaben ... probiere da noch rum).
DC zwischen unterschiedlichen Domains - das heißt Inhalte, die auf unterschiedlichen Domains identisch vorhanden sind (z.B. Pressemitteilungen, XML oder ähnliche Importe von Affili-Content etc.) verschwinden nach und nach von den unterschiedlichen Domains. Noch ist der Prozess relativ langsam: erst werden Die seiten indexiert und dann erst nach einer gewissen Zeit wieder "rausgeschmissen". Was mir beim prüfen mit copyscape.com aufgefallen ist, ist das immer 1-3 Versionen erhalten bleiben - wobei ich noch nicht verstanden habe, nach welchen Kriterien diese 1-3 "Bestandsversionen" im Index verbleiben. Sehr oft sind PR-schwache Seiten bei den verbliebenen Ergebnissen... es sieht fast so aus, alsob ein höherer PR hier (einfach durch häufigeres spidern) zum schnelleren grauen balken führt.
Es sind immer nur Beobachtungen - verstanden was ich da beobachte, habe ich noch nicht.
Für die wichtige Frage, wie groß der "unique" Anteil auf einer Setie sein muss, brauchts sicher auch bessere Rechner als wie misch

Überhaupt nicht einschätzen kann ich z.B. die immer größer werdenden "Zitate" der ganzen Pseudosuchmaschinen ... und die Frage ob und wenn ja welchen Einfluss die bei der DC Problematik spielen könnten. Gerade bei Seiten mit wenig textcontent scheinen aber "Sniptes" von den Pseudos zu einem Problem zu werden ...