Mag alles ein, aber:Jojo hat geschrieben:@MeNoZony
Na, da bin ich anderer Meinung. Auch die Zahl der unterschiedlichen Suchabfragen hat sich vervielfacht. 1998 bestand eine Suchabfrage durchschnittlich aus 1,2 Wörter, heute sind es durchschnittlich 3,3 Wörter. 8% aller Suchen sollen mittlerweile sogar aus 6 oder mehr Wörter bestehen. Vielleicht könnte man sich technisch etwas beschränken wenn man sich erst einmal nur auf eine Sprache konzentriert, aber in jedem Fall braucht es meiner Meinung nach Millionen. Man bräuchte schon eine wirklich zündende Idee für einen neuen Algorithmus um erst einmal das Spammer-Völkchen auszuhebeln um eine Chance zu haben. Sollte das aber jemand schaffen wird er schnell aufgekauft sein. Stichwort "10 Milliarden $ auf den Google-Konten". Yahoo verliert, MSN tut sich schwer und Ask hechelt hinterher, Seekport und Co unter ferner liefen. Mir scheint eine brauchbare Suchmaschine schon eine größere Aufgabe zu sein. Die Chinesen könnten mit Baidu und Co vielleicht noch ein bischen wirbeln, aber das bleibt abzuwarten.
um sich von der PISA-Masse abzuheben reicht bereits ein Wortschatz von 600 Begriffen, die Indianer im Volke nutzen ergo entsprechend weniger. Der Horizont dieser Klientel ist begrenzt, dito also auch die Anforderungen an Inhalte und Algo einer Suchmaschine für das gemeine Volk (der Rest wird sich bei Bedarf bei Spezialsuchmaschinen verlustieren).
Den Bogen weiter gespannt wird man feststellen, daß im Bereich Säks der gewöhnliche Erotomane mit 100-200 Begriffen so ziemlich jede Spielart aufeinanderklatschender Körper abdeckt.
Ich postuliere einfach mal, daß bei Google eher nach "ficken", "fiken" oder "fieken" gesucht wird als nach Schrödinger's Katze.
Wenn man zeitliche Trends einbezieht (Fussball-WM), so ist das zu bietende Angebot für die breite Masse sehr, sehr überschaubar und also auch technisch in kleinen Dimensionen zu händeln- von den Korinthenkackern mal abgesehen, die boshaft in Suchmaschinen Seiten suchen um zu belegen, daß die Suchmaschine Müll ist.
Insofern sind die von den Suchmaschinenbetreibern episch gepriesenen Massen von Daten irrelevante Firlefanzereien, weil man sie zum Geschäftemachen gar nicht braucht- man braucht Sie nur für das eigene Image.
Eine Suchmaschine braucht die Massen um Umsätze zu generieren und die Masse ist nun mal mit sehr wenigen Dingen zufriedenzustellen- siehe die andauernde Existenz von RTL2 oder SuperRTL, 9Live, Herrn Raab und den Hütchenspielern im DSF.
Für dieses Niveau ist ein Suchmaschine schon auf einem Kleinstnetzwerk von normalen Desktop-PCs zu betreiben ohne daß es gravierend auffällt.
Man muß halt nur die Ansprüche runterschrauben auf Massenniveau- nimm diese Massen Google weg und es gehen jede Menge O's flöten...