Seite 1 von 1
dc bei pdf
Verfasst: 19.12.2010, 13:54
von LordOfPage
Ich habe vor, einen bestimmten - längeren - Text, der auf meiner Website auf mehrere html-Seiten verteilt ist, zugleich auch als pdf am Stück anzubieten.
Gibt das ein dc-Problem?
Verfasst:
von
Content Erstellung von
ABAKUS Internet Marketing
Ihre Vorteile:
- einzigartige Texte
- suchmaschinenoptimierte Inhalte
- eine sinnvolle Content-Strategie
- Beratung und Umsetzung
Jetzt anfragen:
0511 / 300325-0
Verfasst: 19.12.2010, 23:23
von Hirnhamster
Ja.
Verfasst: 05.02.2011, 10:25
von Beate
Warum eigentlich?
Verfasst:
von
SEO Consulting bei
ABAKUS Internet Marketing Erfahrung seit 2002
- persönliche Betreuung
- individuelle Beratung
- kompetente Umsetzung
Jetzt anfragen:
0511 / 300325-0.
Verfasst: 05.02.2011, 12:49
von Hirnhamster
Weil PDF und Webseite identischen Inhalt haben. Bei der Berechnung von DC werden die einzelnen Dokumente in Shingles zerteilt und danach wird (Schnittmenge / Vereiningungsmenge) gerechnet. Ein Berechnungsbeispiel findest du auf
https://www.mywebsolution.de/artikel/20 ... ntent.html unten.
Es gibt noch eine erweiterte Variante, bei der auch das sog. containment behandelt wird (Schnittmenge / Menge von Dokument 1) Wenn das PDF den Auszug der Webversion vollständig enthält, ist diese Gleichung = 1 (was 100%igem Containment entspricht).
Beide Verfahren werden in diesem Paper von Andrei Broder vorgestellt:
https://ksuseer1.ist.psu.edu/viewdoc/su ... 1.1.24.779
Ich kann mir nicht vorstellen, dass PDF Dokumente da eine Sonderstellung einnehmen, sonst kannst du ja zu auch einfach fremde PDFs nach HTML übersetzen und auf deiner Seite anzeigen.
Verfasst: 05.02.2011, 13:36
von Beate
Vielen Dank für die ausführlichen Infos und den interessanten Link.
Die rss_feed.php ist dann wohl auch DC?
Worauf man alles so achten muss....seufz

Verfasst: 05.02.2011, 21:03
von Hirnhamster
Was meinst du mit rss_feed.php?
Feed liegen normaleweise in einem XML Format vor und ranken nicht. Hier wäre eine Sonderregelung seitens Google sinnvoll.
Verfasst: 06.02.2011, 09:31
von Beate
Die php Datei generiert den Feed, der im xml Format ausgegeben wird.
Die Inhalte der xml Datei werden also nicht indiziert, die Inhalte von pdf dagegen schon? Wo ist die Logik?
Verfasst: 06.02.2011, 13:40
von Hirnhamster
Die Logik ist, dass PDF ein eigenständiges Format ist, das Daten für MENSCHEN lesbar aufbereitet. XML ist eine strukturierte Auszeichnungssprache, die häufig als universelles Austauschformat für Computer (etc.) benutzt wird.
Verfasst: 11.02.2011, 09:04
von Beate
Hirnhamster, vielen Dank für deine Hilfe, du hast mir sehr geholfen.