Seite 1 von 1

Gibt es "den" richtigen Umstieg/Umzug?

Verfasst: 18.04.2006, 08:28
von In Extremo
Hallo alle zusammen,

ich bin gerade dabei von phpnuke auf drupal umzustellen und habe ein gewaltiges Problem mit den Urls.

Bei einigen Inhalten habe ich dummerweise Umlaute benutzt die auch in der Url jetzt erscheinen.

Jetzt möchte ich auf drupal umstellen, weiss aber nicht was ich mit diesen Seiten machen soll! In der htaccess ist es ja nicht möglich redirects mit Umlauten zu tätigen.

Was kann ich tun um DC zu vermeiden? Bin über jeden Ratschlag dankbar.

Verfasst:
von

Re: Gibt es "den" richtigen Umstieg/Umzug?

Verfasst: 18.04.2006, 08:43
von haha
In Extremo hat geschrieben:In der htaccess ist es ja nicht möglich redirects mit Umlauten zu tätigen.
Nur geraten: Probiere Redirect mit der %-Kodierung des iso-8859-1-Wertes des betreffenden Zeichens, also zum Beispiel %FC statt ü (Tabelle siehe https://de.wikipedia.org/wiki/ISO_8859-1). Falls Du statt iso-8859-1 utf-8 genutzt hast/nutzt, solltest Du auch (nicht nur!) die entsprechenden utf-8-Kodierung probieren, das wäre der iso-8859-1-Wert, utf-8- und dann %-kodierert. Hast Du keine utf-8-Kodierungsmöglichkeit, verwende die Google-Suchmaske: Alles, was Du eingibst, erscheint utf-8- und %-kodiert in der Adressleiste hinter q=.

Verfasst: 18.04.2006, 09:05
von In Extremo
das klappt so irgendwie nicht, hab das in dieser Weise schon probiert :(

nehmen wir das einfache Beispiel

ü.html

ist ja nix anderes als

%FC.html

Die entsprechende RewriteRule müsste doch dann lauten

Code: Alles auswählen

RewriteRule ^%FC.html$ http://www.url.de/neue-domain.html [R=301,L]
Das klappt leider nicht

Gibt es "den" richtigen Umstieg/Umzug?

Verfasst: 18.04.2006, 09:15
von Stoertebeker
Tabelle siehe https://de.wikipedia.org/wiki/ISO_8859-1).
genau dort finde ich diese Tabelle mit den %-Kodierungen nicht - kennt da jemand eine Adresse? Ich brauche eine Tabelle mit diesen Codierungen die das gesamte Spektrum von UTF-8 abdeckt! Ich muss damit eine interntionale DB konvertieren! Für Eure Hilfe wäre ich dankbar.

Gibt es "den" richtigen Umstieg/Umzug?

Verfasst: 18.04.2006, 12:02
von Fantomas
dann mach doch mal den Punkt und die Klammer weg....

https://de.wikipedia.org/wiki/ISO_8859-1

Gibt es "den" richtigen Umstieg/Umzug?

Verfasst: 18.04.2006, 12:03
von Christophe
Hallo Stoertebeker,

wenn du deine bestehenden latin1-Daten urlcodiert in utf-8 umwandeln möchtest, brauchst du: urlencode(utf8_encode($data)).

Ich habe nicht 100% verstanden, was du machen möchtest hier ist aber eine Seite, die sich mit utf-8 beschäftigt: https://www.phpwact.org/php/i18n/charse ... formedness

Gibt es "den" richtigen Umstieg/Umzug?

Verfasst: 18.04.2006, 12:22
von Stoertebeker
Also ich lenke damit zwar vom eigentliche Thread ab und das gehört hier mit Sicherheit nicht hier ins Forum aber ich hoffe das wird an dieser STelle mal geduldet

hier mein Problem. Ich schreibe mit ColdFusion MX 7 in eine MySQL 5 Datenbank. Beide Grundeinstellungen sind auf UTF-8 eingestellt. Funktioniert auch einwandfrei wenn ich Datensätze selber schreibe und auslese. Perfektes Ergebnis! Nur schreibt er für ein ö - ö in die Datenbank. Stört mich auch nicht, weil wenn ich das auslese wird es wieder richtig dargestellt.

Bei der ganzen Sache handelt es sich nun leider um eine internationale Wörterbuch-Datenbank in x Sprachen mit mehreren 100.000 Einträgen die ich als CSV Dateien vorliegen habe. Dort stehen die Dinger natürlich als öäü usw. drin und das missinterpretiert mein Tool. Ich würde nun gern via Parser alle Umlaute (in allen Sprachen) in diese o.a. Strings umwandeln und brauche daher eine Tabelle wo alle UTF-8 Codierungen in diesen nennen wir sie mal %-Codierungen angegeben sind. Dann könnte ich mit einem selbstgebauten Tool die Sache umschreiben lassen und das gewünschte Ergebnis wäre da!

Ich hoffe ich habe mich verständlich ausgedrückt und das nächste Mal bemüh ich wieder mein CF Forum. Aber ihr seid nunmal die Besten! :D :wink:

Re: Gibt es "den" richtigen Umstieg/Umzug?

Verfasst: 18.04.2006, 13:37
von haha
Stoertebeker hat geschrieben:Ich würde nun gern via Parser alle Umlaute (in allen Sprachen) in diese o.a. Strings umwandeln und brauche daher eine Tabelle wo alle UTF-8 Codierungen in diesen nennen wir sie mal %-Codierungen angegeben sind.
Dir ist offenbar nicht bekannt, das utf-8 nur eine Kodierung ist, um Unicode-Werte unfallfrei über Bytekanäle transportieren zu können. Unicode seinerseits hat eine theoretische Kapazität von etwas über vier Milliarden Zeichen, praktisch dürften inzwischen einige Zigtausend definiert sein (siehe https://unicode.org/charts/). Das möchtest Du nicht von Hand programmieren.

Der einzig praktikable Weg, den ich sehe, ist die iconv-Bibliothek. Keine Ahnung, ob sie direkt oder umschrieben in Coldfusion zur Verfügung steht. Falls nicht, musst Du auf PHP oder eine Compiler-Sprache ausweichen.

Du solltest Dich nebenbei bemerkt vorher mit 8-Bit-Zeichensätzen beschäftigen, insbesondere der ISO-8859-Familie und ihrer teilweise inkompatiblen Windows-Erweiterung. Stellst Du den iconv-Eingang auf den falschen Zeichensatz, kommt hinten Müll raus.

Die %-Kodierung ist nichts weiter als die hexadezimale Darstellung eines Bytewertes - das sollte eine Aufgabe für Programmieranfänger sein.

Verfasst: 18.04.2006, 13:59
von haha
In Extremo hat geschrieben:

Code: Alles auswählen

RewriteRule ^%FC.html$ http://www.url.de/neue-domain.html [R=301,L]
Das klappt leider nicht
Was heißt "klappt nicht"? Greift die Umleitung nicht (Browser bleibt bei %FC.html stehen), gibt es eine Fehlermeldung, explodiert der Server?

RewriteEngine on
RewriteBase /
RewriteRule ^ü\.html$ ok.html

schreibt hier bei einem Apache 2.0 klaglos nach ok.html um. Das Muster ^%FC.html$ funktioniert allerdings in der Tat nicht. Falls Dein Editor nicht zufälligerweise mit dem falschen Zeichensatz speichert, wäre eine andere Möglichkeit, den Zeichenwert anzugeben: ^\xfc\.html$ für ü.html. Oder Du benutzt einfach allgemeine Platzhalter: ^.\.html$.

Gibt es "den" richtigen Umstieg/Umzug?

Verfasst: 19.04.2006, 10:38
von In Extremo
Der sagt mir immer das die Seite nicht gefunden wird, nicht die auf die verwiesen wird, sondern die ü.html. Die Regel greift leider nicht :(