Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

mod_rewrite, Umlaute & Codierung

Dieses Forum ist für Informationen über Google gedacht (Ausser PageRank!).
800XE
PostRank 10
PostRank 10
Beiträge: 5223
Registriert: 02.12.2004, 03:03

Beitrag von 800XE » 01.07.2006, 15:09

ah, ja,
es darf nur ein ergebniss nach den select gebe .... so wars gemeint ... klar, logisch


ich war Gedanklich mehr bei Suchfunktion
nicht bei "Artikel wiederfinden"
bei Suche dürfen ja mehrerer Ergebnisse sein

und wenn ich jetzt Dateiname mit BlogÜberschrift vergleiche ....
.... da gibt es mehr Unterschied als nur Ä=ae
z.B. sind im Dateiname keine Leerzeichen


bei einer Volltextsuche würd ichs eventuell gerne Nutzen ...
... aber dem Server zuliebe werd ich es wohl besser doch nicht machen

Anzeige von ABAKUS

von Anzeige von ABAKUS »


Hochwertiger Linkaufbau bei ABAKUS:
  • Google-konformer Linkaufbau
  • nachhaltiges Ranking
  • Linkbuilding Angebote zu fairen Preisen
  • internationale Backlinks
Wir bieten Beratung und Umsetzung.
Jetzt anfragen: 0511 / 300325-0

Georgi
PostRank 4
PostRank 4
Beiträge: 123
Registriert: 29.03.2006, 23:49

Beitrag von Georgi » 02.07.2006, 15:26

URLs sind nicht zwangsläufig mit dem character set kodiert, in dem die Seite kodiert ist. Die ietf hat allerdings schon '99 eine Empfehlung herausgegeben, sie in UTF-8 zu kodieren, was allgemein heute auch so anerkannt ist. Dass Suchmaschinen auch mal Latin-kodierte URLs "akzeptiert" heisst nicht, dass dies auch richtig ist... . Um keine Probleme mit verschiedenen Browsern/Betrübssystemen/Internetprogrämmchen wie Suchmaschinen oder Webserver etc. zu bekommen sollte man also UTF-8 nutzen.

Wir kodieren hier auch per UTF-8, geht eigentlich so, ist nicht immer total lesbar, aber reicht weit. Und auf diese Art gibt es keine Sonderzeichenproblematik. Die ist nämlich mit den hier vorgeschlagenen Methoden nicht 100% lösbar, weil keine bijektiv ist... ; -)

Vodka, Georgi

mcchaos
PostRank 9
PostRank 9
Beiträge: 1414
Registriert: 27.07.2004, 19:18

Beitrag von mcchaos » 02.07.2006, 15:51

Hm, eine Untersuchung, ob die Methode mit Umlaut <-> [umlaut]e - bezogen auf alle gültigen deutschen Worte - nicht doch eine Bijektion ist, wäre interessant. Findet jemand ein Gegenbeispiel?

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


Georgi
PostRank 4
PostRank 4
Beiträge: 123
Registriert: 29.03.2006, 23:49

Beitrag von Georgi » 02.07.2006, 16:12

Ich kann einen Gegenbeweis erstellen:

Es existiert wenigstens ein deutsches Wort, welches gleichermaßen mit ae|oe|ue|ss und ä|ö|ü|ß geschrieben werden kann, wobei beide Worte eine unterschiedliche Bedeutung haben. Ist dies der Fall dann ist die Abbildung nicht bijektiv. Jetzt muss mir nur noch schnell so ein Wort einfallen... - vielleicht fällt Euch ja eines ein? ;- )

Vodka, Georgi

P.S.: Die Auflösung: Ich mache es mir mal einfach und nehme Eigennamen. https://www.google.de/search?hl=de&q=%22Paul+S%C3%BC%C3%9F%22&btnG=Suche&meta=. Wen suche ich denn jetzt, "Paul Süß" oder "Paul Suess"? Hätte ich hier zwei Kandidaten, den einen so, den anderen anders geschrieben, dann könnte ich nicht mehr eindeutig auf die Datenbank abbilden... .

mcchaos
PostRank 9
PostRank 9
Beiträge: 1414
Registriert: 27.07.2004, 19:18

Beitrag von mcchaos » 02.07.2006, 16:24

Stimmt, bei Eigennamen geht es nicht :wink:

Georgi
PostRank 4
PostRank 4
Beiträge: 123
Registriert: 29.03.2006, 23:49

Beitrag von Georgi » 02.07.2006, 16:42

Tja, wie gesagt, die Eigennamen sind ein Schnellschuß. Und leider ist da Google bei der Wortsuche keine Hilfe ;-). Aber ich bin mir sicher, dass es "normale" deutsche Worte gibt, wo dies eben auch nicht funktioniert.

Vodka, Georgi

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag