ich hab hier ne mySQL DB laufen mit rund 1 Mio Datensätzen. Darauf liegt ein fulltext-index, der in einer Suchfunktion mit match ... against ... abgefragt wird.
Jetzt hab ich allerdings ein kleines Umlaut-Problem und zwar hab ich alle Sorten von Umlauten in der DB, also z.B. ö oe und ö (Ein früher Fehler, der sich jetzt rächt).
Jetzt würde ich gerne bei Suchen alle Formen berücksichtigen, also eine Suche nach Möhre soll auch Moehre finden und umgekehrt.
REGEXP gehen bei match against nicht und es muß match against sein, alles andere ist grottenlangsam.
Daten in der MySQL alle in ein Format bringen, also Moehre, Möhre, Möhre sind in der DB Moehre. Vor Suchanfragen mir dem Query das gleiche machen.
Gruss Johannes
SISTRIX Suchmaschinen Blog
SEO- und SEM-Tools: [url=httpss://tools.sistrix.de/toolbox/?tid=lnk_foren_abk]SISTRIX Toolbox[/url]
Linktausch für PR9 und 10 gesucht!
Meiner Erfahrung hilft da alles nix, aus dem Content einen Wortindex generieren und alle Wörter die ein "oe" enthalten manuell durchgehen, ö wird per script zu ö und ö bleibt ö. Es gibt nicht so viele Wörter mit oe, dank Wortliste sollte sich das also in Grenzen halten dann da jedes Wort nur ein mal korrigiert werden muss.