Seite 1 von 1
Wie funktioniert Nutch?!
Verfasst: 16.02.2004, 09:12
von Ravebaby
Hat einer von Euch mal eine gute Beschreibung zu Nutch gefunden?
Die Anleitung auf
www.nutch.org hat mir zwar zum installieren nicht aber zum Verstehen gereicht.
Wie kann ich Nutch vorgeben, welche Seiten es bei der Suche berücksichtigt?
Was macht das System bei der Indexierung, d.h. bei den Schritten
bin/nutch index $s1
bin/nutch index $s2
bin/nutch index $s3
Danke schon einmal für jede Hilfe!!
Verfasst: 17.02.2004, 07:54
von viggen
Hallo Ravebaby,
Schau mal da rein, vielleicht ist was für dich dabei.
https://sourceforge.net/projects/nutch/
mfg
viggen
Verfasst: 13.04.2005, 14:48
von lomo
bin/nutch index erstellt aus der gecrawlten Daten, die im Nutch-Filesystem abgelegt werden einen Index. Bei mir bricht jedoch dieser Vorgang z.Z mit einer JRE-Fehlermeldung ab
Dieser Schritt soll laut Doku im Intranet-Suchmodus entfallen. Jedoch liefert der Nutch-Frontend in dem Falle bei mir keine Treffer (der Index ist halt leer).
Hast du inzwischen neue Erkenntnisse gewonnen und das Ding zum laufen gebracht? Wie hast du das Problem gelöst, das Tomcat und Nutch bei JAVA_HOME Umgebungwariable verschiedene Pfade brauchen. Bei mir läuft dadurch jeweils entweder Nutch oder Tomcat
Ist es nötig, *.war-File nach dem Aufbau des neuen Index neu zu erstellen?
Wie funktioniert Nutch?!
Verfasst: 18.04.2005, 13:50
von danielr
@lomo
ich hab auch die intranetvariante gewählt. (sieh pn, die ich dir geschickt hatte) ich kann gewünschte url spidern und das .war-file habe ich auch rübergeschoben in tomcat und es wird auch entpackt. ich bekommen dann sogar die suchmaske angezeigt im browser, so wie es sein sollte. nur wenn ich dann die suchanfrage abschicke kommen fehler.
hab am tomcat auch nichts weiter konfiguriert. sollte man dort noch was tun? weil es steht nix im tutorial..
gruß,
danielr
Verfasst: 18.04.2005, 14:35
von lomo
beim start von "bin/nutch crawl" kannst du als parameter eine Logdatei angeben. Schau da rein. Wenn der Crawl-Vorgang bei fetchen abbricht, wird anschliessend auch kein Index erstellt. Der Intranetmodus ist auf jeden Fall etwas buggi.
Wie funktioniert Nutch?!
Verfasst: 18.04.2005, 16:12
von danielr
@lomo
das mit "bin/nutch crawl" ist klar und ruft auch keine fehler hervor bzw. keine errormeldungen enthalten nach dem crawl. ist nur komisch, das eben dann, wenn alles eingerichtet ist, so wie es sein sollte, bei der suchanfrage dann nach dem klicken von "suchen" die fehlermeldung kommt. leider find ich auch keine foren etc. die weiterhelfen können...ist irgendwie nicht so weit verbreitet. :/
gruß,
danielr