Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Hmtl extrahieren als Text - Klassifikation

Alles zum Thema: Robots, Spider, Logfile-Auswertung und Reports
Neues Thema Antworten
noizede
PostRank 1
PostRank 1
Beiträge: 1
Registriert: 15.11.2004, 20:37

Beitrag von noizede » 15.11.2004, 20:44

Hallo!

Da ich gerade an einer Uni-Arbeit zum Thema Klassifikation von Webdokumenten arbeite, bräuchte ich eure Hilfe!

Ich suche ein Tool mit dem ich automatisch alle HMTL-Tags aus einem gefundenen (gecrawlten) Dokument entfernen kann - und dann eine Liste mit Termini Zählung erstellt.

Kenn wer so ein (freeware)Tool? Bin für jede Hilfe dankbar ...

Grüße Noizede