Da dürften ähnliche Richtlinien zählen, wie bei handelsüblichem HTML... die SuMa-Crawler verwenden halt nur einen PDF-Filter, und verarbeiten den Text, den dieser Filter erzeugt. Also: Keyword-Dichte, Links, Title (!) ... wenn Du Dir z.B. SERPs mit indizierten PDF-Dokumenten anschaust, dann haben die auch einen Title. Der wurde aus dem PDF extrahiert. Musst also zur Optimierung herausfinden, woran Google erkennt, dass es sich um den Dokumententitel handelt.
Ein PDF hat auch Eigenschaften wie title, thema, Autor und keywords... musste nur über die entsprechenden fpdf-funktionen mit Inhalt belegen... ansonsten würde ich halt auch auf keyworddichte achten und in den überschriften eben auch keywords reinpacken... anhand der größe sollte google eigentlich erkennen können das die größer oder fett gedruckt sind...
Mir geht es um folgendes:
Ich habe Katalog-Seiten (im PDF-Format), die primär aus Grafiken, techn. Details und Artikelnr. + Preisen bestehen. Hab im Dokument also kaum Fliestext, auch keine extra definierten Überschriften.
Kann ich allein über die PDF-Eigenschaften (Titel, Verfasser, Thema, Stichwörter) und ggf. über den Dateinamen selbst (keyword1-keyword2.pdf) schon was erreichen? Wie schätzt ihr die Gewichtung der einzelnen Punkte ein? Werden die Stichwörter vielleicht genauso ignoriert wie in HTML-Dokumenten der Meta-Tag 'keywords'?
Lohnt es sich, eine extra Google XML-Sitemap-Datei anzulegen, wo alle PDF-Dokumente aufgelistet sind?