hat jemand schon Google Search Appliance am laufen, denn wenn ich das richtig verstehe ist das ja ein google das für mich arbeitet. Mit algo und allem
kann man dann nicht sehen wie google funktioniert?
Naja, das benutzt sicherlich nicht die gleichen Mechanismen. Da es nur dazu da ist Intranet, eigene Webseite und Desktop zu durchsuchen braucht es sich auch nicht mit Spam herumzuschlagen.
Die GSA ist nicht nur fürs Intranet, nein auch für die Websuche sehr nützlich. So gibt es Konzernseiten, die nicht vollständig oder sogar wenig von google indiziert sind. Um den User jedoch eine bestmöglcihe Suche zu garantieren (google Qualität), ist die GSA wohl die beste Variante.
Es gäbe noch IBM omnifind, viel zu teuer
Die Google-mini ist jedoch sehr begrenzt in der Anzahl der durchsuchbaren Files.
Und die GSA besitzt die selben mechanismen wie die inet google suche. beide sind halt auf die anzahl der dokumente begrenzt (GSA ca. 500.000 soweit ich weiß).
Als ergebnis wird eine xml ausgespuckt.
ich hatte auch gedacht dem user auf unseren portalen eine gute suche anzubiten, und google ist ja nicht schecht, aber es wäre 3 mil seiten zu durchsuchen und zu sortieren.
nun muß ich mir aber was anderes einfallen lassen, ich könnte zwar nen alten google algo mit cpan nehmen und dann mal schauen was rauskommt, oder mit mysql es versuchen.
kennt jemand vielleicht eine gute anleitung um eine suche zu programmieren, WITH QUERY EXPANSION und soundex usw. kommt man nicht weit denn ich will ja auch noch tippfehler usw wie google umändern. leider habe ich das gefühl daß es mit mysql in deutsch schlecht aussieht,und die mysql eh kein fuzzy unterstützt.