Diese beiden Tatsachen machen sowohl die robots.txt- als auch die .htaccess-Methode überflüssig. Nur ein Anfänger wird HTTrack mit den Standard-Einstellungen benutzen.
Ich empfehle dir dringend - wie andere auch schon - einen Honeypot oder ne Bottrap. Dann hast du nicht nur Ruhe vor HTTrack, sondern auch noch vor anderen (möglicherweise unbekannten) Spidern. Aber beachte auch: Google ist auch ein Crawler ...
