ah, ja,
es darf nur ein ergebniss nach den select gebe .... so wars gemeint ... klar, logisch
ich war Gedanklich mehr bei Suchfunktion
nicht bei "Artikel wiederfinden"
bei Suche dürfen ja mehrerer Ergebnisse sein
und wenn ich jetzt Dateiname mit BlogÜberschrift vergleiche ....
.... da gibt es mehr Unterschied als nur Ä=ae
z.B. sind im Dateiname keine Leerzeichen
bei einer Volltextsuche würd ichs eventuell gerne Nutzen ...
... aber dem Server zuliebe werd ich es wohl besser doch nicht machen
URLs sind nicht zwangsläufig mit dem character set kodiert, in dem die Seite kodiert ist. Die ietf hat allerdings schon '99 eine Empfehlung herausgegeben, sie in UTF-8 zu kodieren, was allgemein heute auch so anerkannt ist. Dass Suchmaschinen auch mal Latin-kodierte URLs "akzeptiert" heisst nicht, dass dies auch richtig ist... . Um keine Probleme mit verschiedenen Browsern/Betrübssystemen/Internetprogrämmchen wie Suchmaschinen oder Webserver etc. zu bekommen sollte man also UTF-8 nutzen.
Wir kodieren hier auch per UTF-8, geht eigentlich so, ist nicht immer total lesbar, aber reicht weit. Und auf diese Art gibt es keine Sonderzeichenproblematik. Die ist nämlich mit den hier vorgeschlagenen Methoden nicht 100% lösbar, weil keine bijektiv ist... ; -)
Hm, eine Untersuchung, ob die Methode mit Umlaut <-> [umlaut]e - bezogen auf alle gültigen deutschen Worte - nicht doch eine Bijektion ist, wäre interessant. Findet jemand ein Gegenbeispiel?
Es existiert wenigstens ein deutsches Wort, welches gleichermaßen mit ae|oe|ue|ss und ä|ö|ü|ß geschrieben werden kann, wobei beide Worte eine unterschiedliche Bedeutung haben. Ist dies der Fall dann ist die Abbildung nicht bijektiv. Jetzt muss mir nur noch schnell so ein Wort einfallen... - vielleicht fällt Euch ja eines ein? ;- )
Vodka, Georgi
P.S.: Die Auflösung: Ich mache es mir mal einfach und nehme Eigennamen. https://www.google.de/search?hl=de&q=%22Paul+S%C3%BC%C3%9F%22&btnG=Suche&meta=. Wen suche ich denn jetzt, "Paul Süß" oder "Paul Suess"? Hätte ich hier zwei Kandidaten, den einen so, den anderen anders geschrieben, dann könnte ich nicht mehr eindeutig auf die Datenbank abbilden... .
Tja, wie gesagt, die Eigennamen sind ein Schnellschuß. Und leider ist da Google bei der Wortsuche keine Hilfe . Aber ich bin mir sicher, dass es "normale" deutsche Worte gibt, wo dies eben auch nicht funktioniert.