Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

HTTrack mit robots.txt draussen lassen

Alles zum Thema: Robots, Spider, Logfile-Auswertung und Reports
Ralf
PostRank 2
PostRank 2
Beiträge: 30
Registriert: 22.02.2004, 08:02
Wohnort: NRW

Beitrag von Ralf » 09.04.2004, 10:27

Hallo zusammen,

ich stelle gerade fest, dass HTTrack 3.0x bei mir reichlich Traffic verursacht.
Das ist nach Eigenaussage ein "Website Copier".
Unter anderem kann man ja auch dann in einem Forum angegebenen E-Mail Adressen mit diesem Programm dieses als "E-Mail Grabbing" nutzen.
Und dann wird gespammt was das Zeug hält.
Da ist der Ärger vorprogrammiert .........

Frage:
Kann ich mit der Robots.txt dieses Proggy aussen vor lassen ?
Würde es mit dieser funktionieren:
User-agent: HTTrack
Disallow: /
User-agent: *
Disallow:
Oder wie sollte dieses aussehen ?

Danke und Grüsse

Ralf