Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Web Crawler

Hier können Sie Ihre Fragen zum Thema Suchmaschinenoptimierung (SEO) / Positionierung stellen
Neues Thema Antworten
student2000
PostRank 1
PostRank 1
Beiträge: 19
Registriert: 21.11.2004, 19:34

Beitrag von student2000 » 24.12.2004, 11:39

Hallo, ich suche einen webcrawler den ich parameterisieren kann, kann einfachster art sein, muss nur text extrahieren können, gibt es soetwas als freeware? Oder kann mir jemand mit guten seiten weiterhelfen?

frohes fest euch allen!!!

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


manute
PostRank 10
PostRank 10
Beiträge: 3010
Registriert: 22.07.2003, 11:02
Wohnort: Hamburg

Beitrag von manute » 24.12.2004, 13:57


Jojo
PostRank 9
PostRank 9
Beiträge: 2847
Registriert: 19.03.2004, 10:33
Wohnort: Papenburg

Beitrag von Jojo » 24.12.2004, 14:50

Weis net so recht was du vor hast, aber vielleicht ist Snoopy für dich noch interessant, damit lassen sich leicht komplette Websites abfragen und ich glaube man kann dies auch nur auf den Text ohne HTML-Quellcode beschränken. (Bin mir da aber nicht so sicher). Wenn du noch selbst dran basteln willst wäre es vielleicht interessant für dich.

https://snoopy.sourceforge.com

student2000
PostRank 1
PostRank 1
Beiträge: 19
Registriert: 21.11.2004, 19:34

Beitrag von student2000 » 25.12.2004, 02:49

Hallo, wie sieht das eigentlich rechtlich aus. Möchte Inhalt einer fremden Seite mit dem bei mir eingestellten vergleichen. Dieses möchte ich automatisieren, eben mit einem crawler. Ist die Nutzung eines Crawlers gestattet, gibt es da irgendetwas zu beachten? Ich weiss google und co nutzen auch welche. Aber deswegen meine Frage, welche vielleicht auch keine ist.

Danke für die Antworten. :)

bull
PostRank 9
PostRank 9
Beiträge: 2166
Registriert: 20.09.2003, 20:57
Wohnort: Vèneto

Beitrag von bull » 25.12.2004, 17:31

robots.txt

Jojo
PostRank 9
PostRank 9
Beiträge: 2847
Registriert: 19.03.2004, 10:33
Wohnort: Papenburg

Beitrag von Jojo » 25.12.2004, 17:35

@bull
Muss ein Crawler eine robots.txt beachten oder sollte er?

bull
PostRank 9
PostRank 9
Beiträge: 2166
Registriert: 20.09.2003, 20:57
Wohnort: Vèneto

Beitrag von bull » 25.12.2004, 17:53

Sollte. Wenn nicht - gibt es einschlägige Foren wie WMW in denen das schneller als man denkt gemeldet wird - und eine Menge Leute sehen Nichtbeachtung von robots.txt als Sperrgrund an. Den einmal gewonnenen schlechten Ruf wird man so schnell nicht mehr los.

student2000
PostRank 1
PostRank 1
Beiträge: 19
Registriert: 21.11.2004, 19:34

Beitrag von student2000 » 27.12.2004, 22:04

Hatte da die seiten eines Auktionshauses im Auge. Mir reicht leider die dort integrierte Suche nach Produktnamen nicht aus. So muss ich unter anderem die Beschreibungen der Artikel in meine Recherche miteinbeziehen. Da ich aber nur nach bestimmten Phrasen suche, wollte ich mir das mit einem Bot erleichtern. Nun habe ich mir die dortige robots.txt mal angeschaut, und meinen Ambitionen wurde ein Strich durch die Rechnung gemacht. Gibt es irgendwie alternativen, die man nutzen könnte?

mfg thomas

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag