Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Charset eines HTML-Documents ermitteln - wie zum Henker?

Ajax, Hijax, Microformats, RDF, Markup, HTML, PHP, CSS, MySQL, htaccess, robots.txt, CGI, Java, Javascript usw.
Neues Thema Antworten
mof7
PostRank 1
PostRank 1
Beiträge: 2
Registriert: 29.01.2013, 17:50

Beitrag von mof7 » 29.01.2013, 18:18

Ich hab da mal ne Frage. Zum Ermitteln des "character set" eines (X)HTML-Dokuments bieten sich meines Wissens 2 Möglichkeiten an:

1. Aus dem HTTP-Response-Header (z.B. "Content-Type: text/html; charset=UTF-8")

2. Aus dem (X)HTML-Dokument selbst (z.B. <meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1" />

Nun stehe ich vor der Frage, welcher Angabe ggf. die höhere Priorität zuzugestehen ist - Nr. 1 oder Nr. 2.

Und wenn ja, warum? :wink: Danke!

Anzeige von ABAKUS

von Anzeige von ABAKUS »

Content Erstellung von ABAKUS Internet Marketing
Ihre Vorteile:
  • einzigartige Texte
  • suchmaschinenoptimierte Inhalte
  • eine sinnvolle Content-Strategie
  • Beratung und Umsetzung
Jetzt anfragen: 0511 / 300325-0

elmex
PostRank 9
PostRank 9
Beiträge: 1009
Registriert: 03.05.2005, 09:09

Beitrag von elmex » 29.01.2013, 20:00

ich hab leider in der Praxis festgestellt, dass beides nicht immer stimmen muss. Manche Programmiersprachen versuchen automatisch das Encoding zu erkennen. Das funktioniert fast am besten...

mof7
PostRank 1
PostRank 1
Beiträge: 2
Registriert: 29.01.2013, 17:50

Beitrag von mof7 » 29.01.2013, 20:07

meinste anhand des inhaltes oder wie? ;-)

ich hab jetzt mal via meines geliebten xampp getestet, was firefox und chrome tun, wenn die beiden angaben differieren. und zwar nehmen beide dann die header-angabe.

cheers.

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


Melegrian
PostRank 10
PostRank 10
Beiträge: 3170
Registriert: 30.01.2005, 12:36

Beitrag von Melegrian » 29.01.2013, 20:39

Oft kommt es zu Fehlern, wenn zwar charset angegeben wird, doch das Dokument nicht entsprechend gespeichert bzw. vor dem Speichern entsprechend konvertiert wird.

Wollte vor wenigen Wochen jemanden bei einem Script helfen, da ging nichts. Irgendwie holte PHP ein Dokument zwar richtig ab und es konnte auch richtig angezeigt werden, doch sowie man mit DOM nur ein Element ausgeben wollte, kam es zu Fehlern bei Oberstrichen und so einem Zeug, egal welcher Zeichensatz verwendet wurde. Ich vermute nur, dass dies irgendwie mit der Libxml zusammenhängen muss oder an dem nicht wohlgeformten/validen Dokument lag, auf welches kein direkter Zugriff bestand. Jedenfalls hörte der Parser nicht auf wegen irgendwelcher Entity zu meckern. Schrieb das Script dann von DOM nach RegEx um, dann ging es.
Scripts und Plugins für Cookie-Hinweise

pointguard
PostRank 1
PostRank 1
Beiträge: 9
Registriert: 14.01.2013, 16:04

Beitrag von pointguard » 07.02.2013, 14:53

Ich hab mir eine eigene Intranet-Webseiten-Testing-Seite erstellt, ähnlich wie Seitenreport.de, nur umfangreicher und natürlich besser 8) ... dabei habe ich die PHP PEAR-Package von w3Validator (https://validator.w3.org/) hergenommen (https://pear.php.net/package/Services_W ... redirected) ... und damit kriegst immer die richtigen Encodings raus ;-)

Falls fragen hast zur technischen Umsetztung dann gib Bescheid... ;-)

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag