Seite 1 von 1

Unterschied zwischen "­-" und "-"

Verfasst: 13.04.2007, 16:23
von Ice Man
Ich stehe hier vor einem eigenartigen Problem

2 Beispiele

Auto - Mercedes
Auto ­- Mercedes

Ihr werdet jetzt sagen, 2 mal das gleiche, aber weit gefehlt.

Kopiert die 2 Zeilen mal und fügt es in eine Textdatei ein.

*tada*

Wodurch kommt das.
Ich hab das Problem, ich hab eine Funktion, die dopplete Einträge filtern soll, irgendwie geht das nun nicht weil die bindestriche eigenartig sind

*grübel*

Verfasst:
von

Verfasst: 13.04.2007, 16:32
von ole1210
Wo hast du diese merkwürdigen Bindestrich her?
Habe sowas noch nie gesehen! Im Quelltext werden ordnungsgemäß 2 angezeigt, in der formatierten Ansicht aber net!

Verfasst: 13.04.2007, 16:32
von Kristian
Hallo

Das eine ist der normale Bindestrich, der seltsame sollte eigentlich UTF-8 sein, wobei Windoof (1252) zwischen den Zeichen von 128 bis 159 (eigentlich reserviert) jetzt auch solchen Schwachfug verbastelt.
Bedank dich bei Bill.

Gruss
Kristian

EDIT: 159 nicht 165...

Verfasst: 13.04.2007, 16:34
von seikodäd
die ascii-tabelle ist dein freund:
https://www.henniger-online.de/design/zeichen.htm

;)

das latin1 bei mysql ist eigentlich cp1252, insofern ist der gedankenstrich durchaus noch bestandteil davon.

Verfasst: 13.04.2007, 16:48
von Ice Man
Jo, das Problem ist aufgetaucht, seit der neuen phpadmin Version.

Da kann man nun die Kollation wählen.
Irgendwie stand das auf "latin1_swedish_ci"

Hab das später auf "latin1_german1_ci" umgestellt.
Ich hoffe das ist nun die richtige Auswahl.
Zuerst dachte ich, ich wäre doof, weil mein Script meinte, die Einträge wären verschieden. Erst durchs kopieren hab ich den unterschied gemerkt.

Verfasst: 13.04.2007, 16:57
von Kristian
Hallo

Die von seikodäd verlinkte Seite sagt nicht ganz die Wahrheit.
https://de.wikipedia.org/wiki/ISO_8859-1
Es wird wohl zu Gunsten von MS jeder Standard kaput gemacht....

Gruss
Kristian

Verfasst: 13.04.2007, 16:58
von seikodäd
wird aber nicht daran gelegen haben... "german", "swedish" etc. bestimmt nur das sortierprinzip, der zeichensatz bleibt der gleiche, d.h., auch in "latin1_german_ci" gibt's diese 2 (insgesamt eigentlich sogar 3) bindestriche (zumindest im latin1 von mysql)...

Verfasst: 13.04.2007, 17:07
von seikodäd
Kristian, wieso, es steht doch oben drüber "[enthält] reservierte Zeichen von 128 bis 159 ( --> Darstellung unsicher)"

Verfasst: 13.04.2007, 17:13
von Kristian
Hallo

Beispiel € (128) gibt es in ISO-8859-1 aka Latin1 nicht.
Damit fing das Übel damals an...

Gruss
Kristian

EDIT: Diese Tabelle sieht für mich nach 1252 aus aber das steht leider nicht dran.

Verfasst: 13.04.2007, 17:35
von seikodäd
steht aber oben drüber, dass die zeichen im iso eigentlich reserviert sind.

Verfasst: 13.04.2007, 17:50
von Kristian
Hallo

Die Position 128 ist in ISO-8859-1 reserviert für den Fall, dass sie irgendwann mal belegt wird.
(seit 1998 nichts mehr passiert)
Derzeit gibt es dort KEIN Zeichen. Die Tabelle ist Windoof-1252.

Sie mag für normale User hilfreich sein, mit dem definierten Standard hat das nichts zu tuen.

Gruss
Kristian