Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

mod_rewrite, Umlaute & Codierung

Dieses Forum ist für Informationen über Google gedacht (Ausser PageRank!).
scnmitz73
PostRank 1
PostRank 1
Beiträge: 10
Registriert: 30.06.2006, 09:49

Beitrag von scnmitz73 » 30.06.2006, 10:11

Zunächst einmal Hallo Zusammen (bin neu hier) 8) ,

ich habe eine Frage zu Umlauten und Sonderzeichen in URLs:
wir haben gerade eine umfassende Website online gestellt und sämtliche URLs per mod_rewrite für Google leserlich gemacht...

Nun ist uns aufgelallen, dass Google & Wikipedia Umlaute und Sonderzeichen per UTF-8 (ä zu %C4%A4) codieren.
Dies scheint aus Suchmaschinensicht die optimale Codierung für Umlaute und Sonderzeichen darzustellen. Wir hingegen nutzen leider einen URL-Encode, der die Sonderzeichen und Umlaute auf andere Weise umwandelt (ä zu %E4):
https://www.google.de/search?hl=de&rls= ... a.de&meta=

Nun ist die Frage, ob wir nicht besser auf UTF-8 umstellen sollten, um zu gewährleisten, dass Google etwaige Suchbegriffe auch in den URLs findet (oder sollte das auch bei unserer Codierung funktionieren?). Falls die Umstellung sinnvoll wäre, stellt sich die Frage, was dann mit den bestehenden (anders codierten) Links in Google passiert - wäre hier ein redirect nötig oder können wir aufgrund der kurzen Historie darauf verzichten?

Vielen Dank!

Marc

Anzeige von ABAKUS

von Anzeige von ABAKUS »


Hochwertiger Linkaufbau bei ABAKUS:
  • Google-konformer Linkaufbau
  • nachhaltiges Ranking
  • Linkbuilding Angebote zu fairen Preisen
  • internationale Backlinks
Wir bieten Beratung und Umsetzung.
Jetzt anfragen: 0511 / 300325-0

haha
PostRank 9
PostRank 9
Beiträge: 1065
Registriert: 03.04.2006, 18:08
Wohnort: Bi Hamborg

Beitrag von haha » 30.06.2006, 10:32

scnmitz73 hat geschrieben:wir haben gerade eine umfassende Website online gestellt und sämtliche URLs per mod_rewrite für Google leserlich gemacht...
Das ist schonmal der grundlegend falsche Ansatz. URLs sollten für Menschen leserlich und benutzbar sein, nicht für Maschinen.
Nun ist uns aufgelallen, dass Google & Wikipedia Umlaute und Sonderzeichen per UTF-8 (ä zu %C4%A4) codieren.
Dies scheint aus Suchmaschinensicht die optimale Codierung für Umlaute und Sonderzeichen darzustellen.
Unicode ist grundsätzlich, nicht nur aus Suchmaschinensicht, die optimale Zeichentabelle. utf-8 dazu ist das geringstmögliche Übel, Unicode in Byteketten zu verfrachten.
Wir hingegen nutzen leider einen URL-Encode, der die Sonderzeichen und Umlaute auf andere Weise umwandelt (ä zu %E4):
Ihr benutzt iso-8859-1 oder windows-1252.
Nun ist die Frage, ob wir nicht besser auf UTF-8 umstellen sollten, um zu gewährleisten, dass Google etwaige Suchbegriffe auch in den URLs findet (oder sollte das auch bei unserer Codierung funktionieren?).
Zeichen außerhalb der Basisbuchstaben A-Z (groß und klein), der Ziffern 0-9 und einiger Satzzeichen sind Fremdkörper in URLs. Von daher wäre es das Klügste, gänzlich auf Umlaute und dergleichen in den URLs zu verzichten - Ihr habt mehr Ärger als Vorteile damit.

Zum einen bieten URLs keine Möglichkeit, transparent die verwendete Kodierung der Gegenstelle mitzuteilen. Die Interpretation der Bytes ist daher ein Ratespiel, unabhängig davon, ob iso-8859-Zeichen kodiert werden oder solche aus Unicode/utf-8.
Von solchen Wackelspielchen hält man sich besser fern. Dass Google Suchanfragen auf eine bestimmte Weise kodiert, hat damit nichts zu tun, denn hier redet Google mit sich selbst.

Zum anderen wird eine Seite nicht an Hand ihrer URL ausgesucht, sondern an Hand ihres Inhalts - dazu gehört auch die URL, aber nicht ausschließlich.
Darüber hinaus ist zumindest Google in der Lage, ä, ö, ü und ß mit der jeweils entsprechenden Variante ae, oe, ue und ss gleichzusetzen (schönes Beispiel: https://www.google.de/search?q=%C3%B6).

Es besteht also überhaupt kein Grund, Sonderzeichen in URLs einzusetzen.
Falls die Umstellung sinnvoll wäre, stellt sich die Frage, was dann mit den bestehenden (anders codierten) Links in Google passiert - wäre hier ein redirect nötig oder können wir aufgrund der kurzen Historie darauf verzichten?
Das müsst Ihr selbst entscheiden. Falls irgendwer von außen auf eine Eurer Seiten verweist, ist es nicht verkehrt, diese URLs umzuleiten bzw. noch besser denjenigen auf die Änderung hinzuweisen.

scnmitz73
PostRank 1
PostRank 1
Beiträge: 10
Registriert: 30.06.2006, 09:49

Beitrag von scnmitz73 » 30.06.2006, 10:58

Hallo haha,

vielen Dank erstmal für die schnelle Antwort!

Du hast natürlich recht, dass URLs usergerecht und nicht suchmaschinengerecht sein sollten und ebenso, dass man auf Umlaute verzichten sollte. Leider erlaubt dies unsere Infrastruktur nicht, da die URLs dynamisch aus der Datenbank auf der Basis von Namen und Bezeichnungen definiert werden - hier lassen sich Umlaute und Sonderzeichen leider nicht vermeiden.

Verstehe ich Deine Antwort richtig, dass in einem solchen Fall UTF-8 eingesetzt werden sollte, da Google dieses interpretieren kann, oder ist iso-8859-1 auch OK?
(https://www.google.de/search?q=%E4 liefert jedenfalls auch ä zurück...)

Dank Dir sehr!

Marc