Ich habe vor, einen bestimmten - längeren - Text, der auf meiner Website auf mehrere html-Seiten verteilt ist, zugleich auch als pdf am Stück anzubieten.
Weil PDF und Webseite identischen Inhalt haben. Bei der Berechnung von DC werden die einzelnen Dokumente in Shingles zerteilt und danach wird (Schnittmenge / Vereiningungsmenge) gerechnet. Ein Berechnungsbeispiel findest du auf https://www.mywebsolution.de/artikel/20 ... ntent.html unten.
Es gibt noch eine erweiterte Variante, bei der auch das sog. containment behandelt wird (Schnittmenge / Menge von Dokument 1) Wenn das PDF den Auszug der Webversion vollständig enthält, ist diese Gleichung = 1 (was 100%igem Containment entspricht).
Ich kann mir nicht vorstellen, dass PDF Dokumente da eine Sonderstellung einnehmen, sonst kannst du ja zu auch einfach fremde PDFs nach HTML übersetzen und auf deiner Seite anzeigen.
Texte/Content schnell und effizient en masse produzieren » Article Wizard «
Was meinst du mit rss_feed.php?
Feed liegen normaleweise in einem XML Format vor und ranken nicht. Hier wäre eine Sonderregelung seitens Google sinnvoll.
Texte/Content schnell und effizient en masse produzieren » Article Wizard «
Die Logik ist, dass PDF ein eigenständiges Format ist, das Daten für MENSCHEN lesbar aufbereitet. XML ist eine strukturierte Auszeichnungssprache, die häufig als universelles Austauschformat für Computer (etc.) benutzt wird.
Texte/Content schnell und effizient en masse produzieren » Article Wizard «