Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

PDF für Google in einem bestimmten Format?

Dieses Forum ist für Informationen über Google gedacht (Ausser PageRank!).
Neues Thema Antworten
tomber
PostRank 1
PostRank 1
Beiträge: 9
Registriert: 09.02.2008, 15:50

Beitrag von tomber » 18.02.2008, 15:33

Hallo!

Muss man bei der Erstellung von PDF's die Google indizieren soll irgendwas beachten? Z.B. am Ausgabeformat.

ich hab hier ein PDF aus dem ich keinen Text rauskopieren kann..hat aber glaub ich nichts mit den Sicherheitseinstellungen zu tun.

Kann Google auch so ein PDF indizieren?

Tom

Anzeige von ABAKUS

von Anzeige von ABAKUS »

Content Erstellung von ABAKUS Internet Marketing
Ihre Vorteile:
  • einzigartige Texte
  • suchmaschinenoptimierte Inhalte
  • eine sinnvolle Content-Strategie
  • Beratung und Umsetzung
Jetzt anfragen: 0511 / 300325-0

chrizz
PostRank 10
PostRank 10
Beiträge: 3044
Registriert: 05.07.2006, 10:37
Wohnort: Berlin

Beitrag von chrizz » 18.02.2008, 16:20

hm. wenn du den Text nicht mit dem Textauswahlwerkzeug rauskopieren kannst, dann liegt das m.E. nach doch an den Sicherheitseinstellungen des Dokuments (Strg+D).
Aber ob Google sowas indiziert... gute Frage. Muss ich passen... aber es sind ja noch genügend andere User hier....vielleicht hat das irgendwer mal getestet :)

tomber
PostRank 1
PostRank 1
Beiträge: 9
Registriert: 09.02.2008, 15:50

Beitrag von tomber » 18.02.2008, 16:55

Hallo!

hab mir gerade mal die Sicherheitseinstellungen des betreffenden PDF angesehen..es sind keine Einschränkungen drauf. Trotzdem kann ich keinen Text rauskopieren..obwohl es mit Acrobat Distiller erstellt wurde. Hier mal der Link zu dem Dokument:

https://www.heilpraxis-zeuthen.de/media ... e-0108.pdf

Aber warum kann ich da keinen Text rauskopieren?? Hmmmm

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


silverbullet
PostRank 7
PostRank 7
Beiträge: 567
Registriert: 29.06.2007, 22:02

Beitrag von silverbullet » 18.02.2008, 16:56

Google kann in pdf-Files nur gerenderten Fließetext lesen, bei gescannten Texten hast du keine Chance.
Winston Churchill im Streit mit einer Frau:
Sie: "Wenn Sie mein Mann wären, würde ich Ihnen Gift in den Tee mischen"
Er: "Wenn Sie meine Frau wären, würde ich ihn trinken".

Jederzeit lieferbar: Texte vom Profi (Journalist/Buchautor) in jedem gewünschten Umfang.

Deutsche Qualitäts-Blogkommentare - Jetzt buchen!

chrizz
PostRank 10
PostRank 10
Beiträge: 3044
Registriert: 05.07.2006, 10:37
Wohnort: Berlin

Beitrag von chrizz » 18.02.2008, 16:59

stimmt.... da gabs ja noch was...^^
Wenn du das Dokument auch digital als Original vorliegen hast (z.B. InDesign, Illustrator, Photoshop usw....), dann nimm mal eine Standardschriftart, die i.d.R. auf jedem PC vorhanden ist und generier nen neues PDF ohne vorher die Schrift in Pfade umzuwandeln... dann sollte es klappen.
Wenns nur nen Scan ist, dann lässt sich da leider nicht machen, ausser abtippen.

silverbullet
PostRank 7
PostRank 7
Beiträge: 567
Registriert: 29.06.2007, 22:02

Beitrag von silverbullet » 18.02.2008, 17:00

Das ist ein gescanntes Dokument, da kriegste trotz fehlendem Sicherheitsschutz keinen Text rauskopiert.
Winston Churchill im Streit mit einer Frau:
Sie: "Wenn Sie mein Mann wären, würde ich Ihnen Gift in den Tee mischen"
Er: "Wenn Sie meine Frau wären, würde ich ihn trinken".

Jederzeit lieferbar: Texte vom Profi (Journalist/Buchautor) in jedem gewünschten Umfang.

Deutsche Qualitäts-Blogkommentare - Jetzt buchen!

chrizz
PostRank 10
PostRank 10
Beiträge: 3044
Registriert: 05.07.2006, 10:37
Wohnort: Berlin

Beitrag von chrizz » 18.02.2008, 18:19

das ist mir schon klar. Deswg. war die Frage ja, ob das Dok vielleicht auch noch in digitaler Originalform vorliegt. Das man aus nem Scan nichts/wenig machen kann weiß ich :o)

@tomber: Deine Frage dürfte übrigens in diesem Thread beantwortet worden sein:
https://www.abakus-internet-marketing.d ... 53089.html

Sniper
PostRank 5
PostRank 5
Beiträge: 228
Registriert: 29.04.2006, 16:45
Wohnort: Westerwald

Beitrag von Sniper » 19.02.2008, 09:36

Kannst Du da nicht mit einem OCR drübergehen?
Mir persönlich wäre es die Sache wert, da ja Dokumente auch indiziert werden und Content kann man/frau ja nie genug haben...
Grüße aus dem Westerwald
Günni

ole1210
PostRank 10
PostRank 10
Beiträge: 7464
Registriert: 12.08.2005, 10:40
Wohnort: Olpe

Beitrag von ole1210 » 19.02.2008, 11:05

Muss man bei der Erstellung von PDF's die Google indizieren soll irgendwas beachten? Z.B. am Ausgabeformat.
Jepp. Google indiziert PDFs nur, wenn diese als html oder php abgescheichert werden...

e-fee
PostRank 10
PostRank 10
Beiträge: 3893
Registriert: 08.05.2007, 12:53

Beitrag von e-fee » 19.02.2008, 12:17

ole1210 hat geschrieben:
Muss man bei der Erstellung von PDF's die Google indizieren soll irgendwas beachten? Z.B. am Ausgabeformat.
Jepp. Google indiziert PDFs nur, wenn diese als html oder php abgescheichert werden...

Kannst Du diese These mal näher erläutern? Wie kommst Du auf dieses schmale Brett?

Also ich kenne genügend indizierte PDFs, die als .pdf abgespeichert sind. Oder meinst Du irgendwas anderes?

Ich hab z.B. ganz simpel per OpenOffice Dateien (selbst 'ne Präsentation) als PDF gespeichert (application/pdf-Objekt), und die sind alle im Google-Index.
Mir ist aus den Erinnerungen, die ich am mein Embedded-Metadata-Seminar im vergangenen Semester (und da speziell die Sitzung, in der wir den Aufbau von PDF-Dateien auseinanderklamüsert haben) habe, auch nichts bekannt, inwieweit da HTML oder gar PHP (was zum Teufel hat PHP als serverseitige Sprache damit zu tun???) eine Rolle spielen sollen. Selbst für interne Formatierung, die ggf. als String-Objekt im PDF liegen könnte, erwarte ich doch eigentlich eher irgendein XML-Derivat, aber nicht unbedingt HTML, oder?

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag