Die Fragestellung für "gleichen Content" ist nicht, ob man das mit Recht oder Erlaubniss zwei- oder mehrmals veröffentlicht sondern einfach, ob er gleich ist oder nicht.
Was macht es für einen Sinn für eine Suchmaschine, den gleichen dpa-Artikel 5000 mal im index zu haben und zu halten? Für den Suchenden genügt der Text einmal. Für die Suchmaschine wird das dann wohl heißen, das der Text auch nur einmal vorhanden sein muss. Soweit, das in den Indexen der SuMas wirklich nur alle Texte einmal sind, ists allerdings noch nicht.
Für eine Webseite kann es durchaus sinnvoll sein, genau diesen Artikel den eigenen Usern anzubieten - auch wenn genau der Artikel mittelfristig nix für eigene SuMa-Positionen bringt. Aber nicht jede Aktion eines Webmasters muss sich um die SuMas drehen

.
Ich weiß noch nicht, was das Aussortieren von einzelnen Seiten, die von SuMas als doppelter Content erkannt und aus deren Indexen verschwunden sind für die Stärke der Domain selbst bedeutet. So linkt man zum Beispiel ja auf eine Seite, die nicht mehr zurücklinken kann - weil es sie im index nicht gibt. Wenn ausschließlich mit solchem - wenn auch legal erworbenen - DC gearbeitet wird, werden ja nach und nach alle Seiten aussortiert, die es im Netz an anderer Stelle schon gibt. Wie hoch der Anteil von "unique" sein muss (Also Veränderungen, Ergänzungen etc...), damit eine Seite eigenen Wert hat, habe ich auch noch nicht herausgefunden. Von der Logik her müste man wahrscheinlich vom Content allen Fremdcontent + alle auf den eigenen Seiten immer wiederkehrende Elemente (Navigation zum Beispiel) abziehen und schauen, was übrigbleibt. Wenn das dann genug ist, um "unique" zu sein, wird die Seite wohl auch langfristig Bestand haben.
Nach welchen Kriterien die Seiten "ausgewählt" werden, bei denen im Netz häufig genutzter Inhalt nicht aussortiert wird - also das "Orginal" bestehen bleibt - ist mir noch völlig schleierhaft. Insbesondere spannend fände ich da die Frage, ob und wie der "eigentliche Urheber" festgestellt wird (werden kann) oder ob das (für die SuMas) keine Bedeutung hat, ob Faktoren wie "zuerst gefunden bei" wichtig sind oder "Stärke der Domain" oder themenrelevanz oder oder oder - halt welche Kriterien beim "aussortieren" gelten.
Das Einzige wirklich sichere ist, das immer mehr DC "aussortiert" wird ...