Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Spider, der nach Bildern sucht

Alles zum Thema: Robots, Spider, Logfile-Auswertung und Reports
Neues Thema Antworten
beachdiddi
PostRank 1
PostRank 1
Beiträge: 4
Registriert: 09.04.2007, 10:19
Wohnort: Bayern

Beitrag von beachdiddi » 09.04.2007, 10:25

Hallo Zusammen!

Wie schon aus dem Titel zu entnehmen ist, bin ich auf der Suche nach einem kleinen Robot, mit dem ich durch das Web crawlen kann.
Ich will keine Suchmaschine bauen, das heißt ich will nicht alle Seiten speichern oder indizieren.
Mein eigentliches Ziel ist es auf den Seiten nach Bildern zu suchen und diese mit einer eigenen Methode auf Gleichheit mit vorhandenen Bildern in einem Ordner, die auf der Festplatte gespeichert sind, zu vergleichen. (Es geht ums Urheberrecht von Bildern)

Da es sich um ein vorgegebenes Projekt handelt bin ich an Java gebunden. Ich habe auch schon einige Webspider gefunden. (Snatch, Websphinx). Jedoch noch keinen, der meine Ansprüche erfüllt. Die meisten bieten schon fast zu viel Funktionalität.
Ich habe auch nicht erwartet einen zu finden. Aber falls es so gewesen wäre, wäre das ja für mich extrem arbeitserleichternd gewesen. :D

Mich würde interessieren was ihr denkt wie ich vorgehen sollte.
Sollte ich einen vorgefertigten Spider nehmen und diesen auf meine Bedürfnisse zuschneiden?
Oder lieber doch von Grund auf selbst einen programmieren?
Ich kann nicht einschätzen was sinnvoller ist. Ich denke, dass sowohl das anpassen eines vorhandenen Spiders schwierig ist, als auch das Schreiben eines Eigenen.
Wahrscheinlich hat ja jemand von euch Erfahrung mit Spidern und hat vielleicht einen Tip auf Lager.

Vielen Dank schonmal im voraus,

mfg, beachdiddi

Anzeige von ABAKUS

von Anzeige von ABAKUS »


Hochwertiger Linkaufbau bei ABAKUS:
  • Google-konformer Linkaufbau
  • nachhaltiges Ranking
  • Linkbuilding Angebote zu fairen Preisen
  • internationale Backlinks
Wir bieten Beratung und Umsetzung.
Jetzt anfragen: 0511 / 300325-0

blinkster
PostRank 3
PostRank 3
Beiträge: 96
Registriert: 26.10.2005, 17:41

Beitrag von blinkster » 10.04.2007, 12:51

Hallo,

also ich habe mal vor Jahren selbst einen geschrieben. Allerdings zum crawlen von Webseiten mit Spamfilter etc.

Ein Tipp vorne weg: Programmiere auf keinen Fall in PHP, du stößt bei der Sprache ganz schnell an die Grenzen des Machbaren. Und ich rede da nicht nur von der krückenhaften Verarbeitung von PHP... :roll:
Linktausch oder Ads (20.000 Impressions/Monat)? Mail per PN: Computer/EDV/et cetera
Blinkster.de - yet another computer forum
4 Euro pro 1000 Besucher verdienen

beachdiddi
PostRank 1
PostRank 1
Beiträge: 4
Registriert: 09.04.2007, 10:19
Wohnort: Bayern

Beitrag von beachdiddi » 10.04.2007, 16:11

blinkster hat geschrieben:Hallo,

also ich habe mal vor Jahren selbst einen geschrieben. Allerdings zum crawlen von Webseiten mit Spamfilter etc.

Ein Tipp vorne weg: Programmiere auf keinen Fall in PHP, du stößt bei der Sprache ganz schnell an die Grenzen des Machbaren. Und ich rede da nicht nur von der krückenhaften Verarbeitung von PHP... :roll:
Ok, danke für den Tip mit PHP. Da ich das Ganze sowieso in Java implementieren will, stellt sich die Frage nach PHP für mich aber überhaupt nicht. :)

Was ist Deine Meinung zum Aufwand? Anpassen oder selbst schreiben???