Seite 1 von 1
Content
Verfasst: 20.02.2006, 17:12
von geli32
Hallo,
vieleicht kann mir jemand weiterhelfen.
Jemand hat mir die Erlaubnis gegeben seine Dissertation auf meiner Seite online zu stellen.
Jetzt hat er selber auf seiner Seite diese Arbeit als PDF zum runterladen gestellt.
Ich wollte jetzt die ganze Abrbeit über viele Seiten, mit H1 - H3 Überschriften stellen.
Wäre das dann bei mir doppelter Content und damit schädlich für mich ????
Es ist ja auch eine Menge Arbeit das PDF als einzelne Seiten darzustellen.
Lohnt sich das ?
Content
Verfasst: 20.02.2006, 17:49
von Redakteur
Naja, wenn du der Einzige bist, der diesen Content auch hat und eventuell noch andere Inhalte auf deinem Projekt hast, dass ist es der Mühe wert!
Besser ist jedoch - ganz klar - unique Content
Content
Verfasst: 20.02.2006, 17:50
von rechtlegal
Ich würde mal nach doppelter content hier im Forum suchen.
Content
Verfasst: 20.02.2006, 18:10
von geli32
Ich habe schon gesucht, habe aber nichts im Bezug Content/PDF gefunden.
Sieht den Goggle einen PDF Download als richtigen Content ? Ich dachte wenn ich alles auf viele Seiten aufsplitte ist das vielleicht etwas anderes.
Ja ich wäre wirklich die einzigste, die den Text auch hat ( Text ist gut, die ganze Arbeit hat über 200 Seiten )
Verfasst: 20.02.2006, 19:32
von samaluli
Hallo,
ich kann mir nicht vorstellen, dass G**gle hier einen doppelten Content erkennt. Auf der einen Seite hast du ein langes PDF-Dokument, auf der anderen Seite teilst du den Inhalt auf viele Hypertext-Dokumente auf.
G**gle ist schließlich nur eine Maschine!
Mit besten Grüßen
Samaluli
Content
Verfasst: 20.02.2006, 19:33
von ArturO
Google kann PDF Dokumente spidern und indexieren. Gucke mal ob die URL des PDF-Dokumentes einen Cache-Inhalt hat. Ich denke, dass es auch zwischen PDF-HTML Dokumenten DC geben kann, denn zwischen PHP-HTMl gibt es das phänomen ja auch. Desweiteren bin ich mir nicht sicher, denke aber dass auch Teilfragmente eines Textes als Teil eines Ganzen identifiziert werden kann und im Zuge von DC abgewertet wird.
Content
Verfasst: 20.02.2006, 19:35
von FuchsT
man kann das pdf ja für google aussperren.
robos.txt oder ähnlich
gruß
thomas
Content
Verfasst: 20.02.2006, 19:44
von Redakteur
Natürlich erkennt Google die doppelten Inhalte.
Ich wage aber zu behaupten: In dieser Größenordnung hast du nichts zu befürchten.
Content
Verfasst: 20.02.2006, 21:07
von rechtlegal
@Redakteur
Täusche ist mich, oder ist Dein Footer automatisch immer 5 x so lang wie Deine Beiträge? [/OT]

Content
Verfasst: 21.02.2006, 07:32
von Redakteur
@rechtlegal
hmmm....lass mal zählen.
Ja, hast Recht.
Re: Content
Verfasst: 21.02.2006, 08:50
von Freilaufender
ArturO hat geschrieben:...denn zwischen PHP-HTMl gibt es das phänomen ja auch. ....
Unsinn, denn PHP läuft nur und ausschliesslich Serverseitig. Lediglich das HTML-Ausgabe-Ergebnis kann als DC gewertet werden, denn Google kann nicht unterscheiden, ob es sich um eine statische HTML-Seite oder eine mit der geeigneten Technik erstellten PHP-Seite handelt.
Ein auf mehrere Seiten aufgeteiltes PDF, das sauber optimiert wurde, kann gar nicht als DC gewertet werden, da diverse Teile des Dokuments anders erscheinen, als im Original-Dokument.
Du wirst mit dieser Lösung ganz sicher bei vielen Suchergebnissen vor dem eigentlichen PDF in den Serps auftauchen, der Aufwand lohnt also.