Beitrag
von Mac » 08.09.2005, 23:34
Hi,
"was", "und" und "ist" sind für google sogenannte "Stopwörter". Die werden bei der Suche wohl ignoriert, entgegen dem, was ax's preisgekröntes Werkzeug anzeigt. G. sucht auch nicht (nur) nach dem String "[keyword1][keyword2][keyword3][etc.]", sondern genauso (oder mehr) nach den einzelnen Keywords und gewichtet (dann) danach, wie nahe diese beieinanderstehen - sagt das Gerücht.
Was nun die unterschiedlichen Ergebnisse bei der Zwei-Wort und der Vier-Wort-Suchanfrage betrifft, fällt auf, daß bei der Zwei-Wort-Frage drei Seiten zwischen Dir und der Nummer 1 stehen, die noch viel mehr Informationen zum Thema Tee enthalten (gesundheit.de...., swr.de...tee...). Bei den Vier-Wort-Anfragen hingegen liegst Du nicht auf 5 und 6, sondern auf 2 und 3. Du kannst das Ergebnis mit "und und weisser tee" oder auch "bis bis weisser tee" reproduzieren.
Ich bewege mich jetzt im Bereich purer Spekulation. Aber vielleicht ändert sich bei komplexeren Suchanfragen (selbst, wenn die Stopwörter enthalten) die Gewichtung. Bei einer kurzen Anfrage gleicht ein Überfluss an "Tee" einen Mangel an "weisser" aus, denn wer nur zwei Suchbegriffe eingibt, sucht eher allgemeinere Informationen. Bei einer "komplexeren" Suchanfrage, die aus vier Elementen besteht (selbst, wenn google zwei davon für die Suche ignoriert) weiß der Benutzer, jedenfalls für den Algorithmus, schon eher, was er will. Also muß auch das zahlenmäßige Verhältnis zwischen den Keywords stimmen, da wäre dann z.B. 2:2 besser als 5:1. Und deshalb kommt bei der Vier-Wort-Anfrage weisser tee weisser tee besser als weisser tee tee tee tee tee tee.
Wer zerreißt diese Theorie?
Gruß
Mac