Beitrag
von Melegrian » 29.01.2013, 20:39
Oft kommt es zu Fehlern, wenn zwar charset angegeben wird, doch das Dokument nicht entsprechend gespeichert bzw. vor dem Speichern entsprechend konvertiert wird.
Wollte vor wenigen Wochen jemanden bei einem Script helfen, da ging nichts. Irgendwie holte PHP ein Dokument zwar richtig ab und es konnte auch richtig angezeigt werden, doch sowie man mit DOM nur ein Element ausgeben wollte, kam es zu Fehlern bei Oberstrichen und so einem Zeug, egal welcher Zeichensatz verwendet wurde. Ich vermute nur, dass dies irgendwie mit der Libxml zusammenhängen muss oder an dem nicht wohlgeformten/validen Dokument lag, auf welches kein direkter Zugriff bestand. Jedenfalls hörte der Parser nicht auf wegen irgendwelcher Entity zu meckern. Schrieb das Script dann von DOM nach RegEx um, dann ging es.