Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Russische DMOZ Kategorien - wie darstellen?

Hier können Sie Ihre Fragen zum Thema Suchmaschinenoptimierung (SEO) / Positionierung stellen
Neues Thema Antworten
Airport1
PostRank 10
PostRank 10
Beiträge: 4489
Registriert: 16.08.2004, 18:50
Wohnort: Backnang / bei Stuttgart

Beitrag von Airport1 » 31.03.2005, 03:11

Kurz die Problemstellung:

Ermittle zu Domains den DMOZ Eintrag, nutze dazu die PHP Funktion utf8_decode() damit z.B. Umlaute wie in

Persönliche_Homepages

auch richtig konvertiert werden. Funzt auch bei allen Deutschen Kategorien wunderbar, bei russischen DMOZ Kategorien jedoch gar nicht, Beispiel:
https://www.ranking-hits.de/user/www.ruslink.de

Hier erscheint als Kategorie:
Top/World/Russian/??????_?_???????/??????/????????/????????????_?_????????

Ich habe schon versucht die Statistik Webseite per header() UND Meta in UTF-8 auszuliefern, es brachte jedoch keine Besserung (ausser dass dann natuerlich die deutschen Umlaute auch kaputt sind - immerhin ein Indiz dass wirklich UTF-8 ausgeliefert wurde ;-)).

Nun ratlos, weiss jemand weiter? robo?
Zuletzt geändert von Airport1 am 31.03.2005, 03:14, insgesamt 1-mal geändert.
Linktauschanfragen zwecklos
https://www.bot-trap.de/ Spamschutz fuer Webmaster - zentrale Meldestelle fuer Web Spam
https://www.airport1.de/blog/ Lombagruschd Blog mid Gardadierle
https://www.ranking-hits.de/ Counter & PR Service

Anzeige von ABAKUS

von Anzeige von ABAKUS »

Content Erstellung von ABAKUS Internet Marketing
Ihre Vorteile:
  • einzigartige Texte
  • suchmaschinenoptimierte Inhalte
  • eine sinnvolle Content-Strategie
  • Beratung und Umsetzung
Jetzt anfragen: 0511 / 300325-0

Moddy
PostRank 8
PostRank 8
Beiträge: 771
Registriert: 08.09.2004, 11:16

Beitrag von Moddy » 31.03.2005, 03:14

Schonmal versucht auf deinem rechner die russischen Zeichen zu installieren?
Hatte das problem auchmal, Windows Cd rein, weiter Sprachpakete installiert und siehe da ... Funzt :)

Airport1
PostRank 10
PostRank 10
Beiträge: 4489
Registriert: 16.08.2004, 18:50
Wohnort: Backnang / bei Stuttgart

Beitrag von Airport1 » 31.03.2005, 03:18

Moddy, erscheinen bei Dir - wenn Du die o.g. Statistik-URL aufrufst - russische Zeichen? Wichtige Frage!

Wenn ich direkt die ruslink Domain aufrufe erscheint diese bei mir mit russischem Zeichensatz. Liegt vielleicht daran dass die Seite folgenden META verwendet - laeuft das bei allen russischen Webseiten so?:

<meta http-equiv="Content-Type" content="text/html; charset=windows-1251">
Linktauschanfragen zwecklos
https://www.bot-trap.de/ Spamschutz fuer Webmaster - zentrale Meldestelle fuer Web Spam
https://www.airport1.de/blog/ Lombagruschd Blog mid Gardadierle
https://www.ranking-hits.de/ Counter & PR Service

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


dein_opi
PostRank 6
PostRank 6
Beiträge: 352
Registriert: 13.06.2004, 20:07
Wohnort: Göttingen

Beitrag von dein_opi » 31.03.2005, 09:01

Airport1 hat geschrieben:<meta http-equiv="Content-Type" content="text/html; charset=windows-1251">
ja, das ist für die darstellung der kyrilischen zeichensätze notwendig

lomo
PostRank 6
PostRank 6
Beiträge: 346
Registriert: 05.08.2004, 13:01

Beitrag von lomo » 31.03.2005, 09:26

Bei der "russischen AltaVista" https://www.yandex.ru/ wird kyrillisch korrekt dargestellt, ohne dass der richtige Zeichensatz in HTML definiert wird. Kyrillischen Zeichensatz auf meinem Rechner habe ich auch nicht (bzw. habe ich diesen nicht bewusst installiert)

Nexus
PostRank 4
PostRank 4
Beiträge: 105
Registriert: 22.01.2004, 10:03
Wohnort: (DE|NRW|OWL)

Beitrag von Nexus » 31.03.2005, 10:38

Hi,
Hier erscheint als Kategorie:
Top/World/Russian/??????_?_???????/??????/????????/????????????_?_????????
Wenn du utf8_decode() benutzt, werden alle Zeichen die im Zielzeichensatz nicht vorhanden sind durch ? ersetzt.

Die russischen, chinesischen und alle weiteren Kategorien funzen in UTF-8 ohne Probleme. Du musst aber konsequent alles in UTF-8 machen: DB, Script-Quelltext usw.

Wo holst du denn die Kategorien weg? Wenn die vorher schon in einem anderen Zeichensatz vorliegen kannst du nichts mehr machen. Du brauchst den UTF-8-String. (Am besten aus dem RDF-Dump holen).

Gruß
Raphael

Airport1
PostRank 10
PostRank 10
Beiträge: 4489
Registriert: 16.08.2004, 18:50
Wohnort: Backnang / bei Stuttgart

Beitrag von Airport1 » 31.03.2005, 12:45

@lomo: bei yandex wird der Charset per header() gesetzt, siehe letzte Zeile:

Response Header from Server (Origin Server, Server or Proxy):
HTTP/1.1 200 OK
Date: Thu, 31 Mar 2005 10:46:00 GMT
Server: Apache/1.3.6 (Unix) PHP/4.0.1pl2 mod_perl/1.19 mod_deflate/1.0.21 rus/PL28.15
Set-Cookie: yandexuid=8365721112265960; path=/; domain=.yandex.ru; expires=Friday, 31-Dec-10 23:59:59 GMT
Last-Modified: Thu, 31 Mar 2005 10:45:01 GMT
Cache-Control: max-age=300, private, proxy-revalidate
Expires: Thu, 31 Mar 2005 10:51:00 GMT
Connection: close
Content-Type: text/html; charset=windows-1251

@Nexus: also DMOZ Kategorie ohne utf8_decode direkt in die DB schreiben, und beim Auslesen aus der DB die Webseite per header/meta in utf-8 ausliefern? Oder vielleicht nach dem Auslesen erst utf8_decode und dann in "windows-1251" ausgeben, wie es ja anscheinend alle russischen Seiten machen ;-) ?
Linktauschanfragen zwecklos
https://www.bot-trap.de/ Spamschutz fuer Webmaster - zentrale Meldestelle fuer Web Spam
https://www.airport1.de/blog/ Lombagruschd Blog mid Gardadierle
https://www.ranking-hits.de/ Counter & PR Service

Nexus
PostRank 4
PostRank 4
Beiträge: 105
Registriert: 22.01.2004, 10:03
Wohnort: (DE|NRW|OWL)

Beitrag von Nexus » 31.03.2005, 13:24

Hi,
@Nexus: also DMOZ Kategorie ohne utf8_decode direkt in die DB schreiben, und beim Auslesen aus der DB die Webseite per header/meta in utf-8 ausliefern?
Genau so. Macht keierlei Probleme.

utf8_decode würde niemals funktionieren das hier der Zielzeichensatz immer ISO-8859-1 ist, und dieser die russischen Zeichen nicht darstellen kann. Du wirst also immer ?? erhalten.

Wenn du unbedingt konvertieren willst solltest du dir iconv() anschauen. Damit kannst du den Zielzeichensatz angeben.

Gruß
Nexus

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag