Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Neugieriger Bot (?)

Alles zum Thema: Robots, Spider, Logfile-Auswertung und Reports
Neues Thema Antworten
Chuck Lorre
PostRank 1
PostRank 1
Beiträge: 16
Registriert: 21.09.2011, 12:38

Beitrag von Chuck Lorre » 30.01.2012, 18:33

Der hier

Code: Alles auswählen

XX.XXX.XX.XXX - - [30/Jan/2012:17:15:26 +0100] "GET /XXXXXXX/XXX.jpg HTTP/1.1" 200 5922 www.XXX. de "-" "Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.9.0.10) Gecko/2009042316 Firefox/3.0.10" "10.15.7.65, 10.15.7.34"
taucht in meinen Logs seit ein paar Tagen unter verschiedenen IPs aus dem Berliner Raum und mit verschiedenen User-Agents auf. Immer gleich sind nur die Zifferngruppen zwischen den letzten Anführungszeichen. Greift mit Vorliebe in einem Rutsch auf mehrere Grafikdateien zu, auch in für Bots gesperrten Verzeichnissen.

Weiß jemand zufällig, was sich dahinter verbirgt und wie man das ggf. über .htaccess abstellen kann? Ich weiß zwar, wie man User-Agents z.B. über SetEnvIfNoCase blocken kann und ein paar andere grundlegende Dinge, bin aber mit der Abfrage dieser letzten Zahlengruppen überfordert :cry: .

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


CyberNibbler
PostRank 5
PostRank 5
Beiträge: 283
Registriert: 19.08.2008, 16:57
Wohnort: Berlin

Beitrag von CyberNibbler » 30.01.2012, 19:01

Du könntest den Client aussperren, würdest aber ggf. auch normale Besucher aussperren.
Wenn der "böse Crawler" clever ist, kann er dann auch einfach den Client-String ändern.
Eine perfekte Lösung wirst du nicht finden.

Hast du keine Wasserzeichen auf den Bildern? Oder stört dich nur der Traffic?

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag