Seite 1 von 1

mySQL-Frage

Verfasst: 06.12.2004, 23:55
von warry
Hallo,

ich hab hier ne mySQL DB laufen mit rund 1 Mio Datensätzen. Darauf liegt ein fulltext-index, der in einer Suchfunktion mit match ... against ... abgefragt wird.

Jetzt hab ich allerdings ein kleines Umlaut-Problem und zwar hab ich alle Sorten von Umlauten in der DB, also z.B. ö oe und ö (Ein früher Fehler, der sich jetzt rächt).

Jetzt würde ich gerne bei Suchen alle Formen berücksichtigen, also eine Suche nach Möhre soll auch Moehre finden und umgekehrt.

REGEXP gehen bei match against nicht und es muß match against sein, alles andere ist grottenlangsam.

Irgendjemand ne Idee?

Gruß
Franz

Verfasst:
von
Content Erstellung von ABAKUS Internet Marketing
Ihre Vorteile:
  • einzigartige Texte
  • suchmaschinenoptimierte Inhalte
  • eine sinnvolle Content-Strategie
  • Beratung und Umsetzung
Jetzt anfragen: 0511 / 300325-0

Verfasst: 07.12.2004, 01:06
von Jojo
Schreib doch ein kleines Script das deine früheren Fehler behebt. Damit müsste sich zumindest "ö" schonmal umwandeln lassen.

Verfasst: 07.12.2004, 09:01
von HW
..braucht man dazu ein Script? :o

Reicht da nicht eine einfache Abfrage aus?

Die wird zwar etwas dauern, aber 1Mio Datensätze ist auch nicht viel.

Verfasst:
von

Verfasst: 07.12.2004, 09:36
von SISTRIX
Daten in der MySQL alle in ein Format bringen, also Moehre, Möhre, Möhre sind in der DB Moehre. Vor Suchanfragen mir dem Query das gleiche machen.

Gruss Johannes

Verfasst: 08.12.2004, 11:41
von pi-de
Würde ich auch empfehlen.
Ein kurzes Skript drüberlaufen lassen das alle Umlaute
in ein einheitliches Format konvertiert.

Arbeite am Besten mit 'LIMIT' wegen der Execution Time.
Bei 1Mio DS dürfte es etwas mehr Aufwand sein (ich nehme
an es sind BLOB-Felder)

Hinweis:
Pass auf bei Wörtern wie Frauen.
Alle ue etc in ü umzuwandeln könnte ganz
böse etwas verreißen.

Verfasst: 08.12.2004, 12:38
von warry
Ha, dann würde sich also wohl eher die 2-Buchstaben-Variante empfehlen, also ue oe usw.

Ich denke, so werde ich es machen, vielen Dank.

Greets
warry

Verfasst: 08.12.2004, 21:51
von Southmedia
Meiner Erfahrung hilft da alles nix, aus dem Content einen Wortindex generieren und alle Wörter die ein "oe" enthalten manuell durchgehen, &ouml wird per script zu ö und ö bleibt ö. Es gibt nicht so viele Wörter mit oe, dank Wortliste sollte sich das also in Grenzen halten dann da jedes Wort nur ein mal korrigiert werden muss.