Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

ia_archiver missachtet robots.txt

Alles zum Thema: Robots, Spider, Logfile-Auswertung und Reports
Neues Thema Antworten
luigip
PostRank 8
PostRank 8
Beiträge: 892
Registriert: 24.01.2005, 18:22

Beitrag von luigip » 30.05.2006, 14:38

Obwohl der alexa-bot sich sonst an das Verbot in der robots.txt gehalten hat, versucht er nun munter auf die logfiles zuzugreifen:

209.237.238.235 - - [30/May/2006:03:57:43 +0200] "GET /logs/access.log.20.3 HTTP/1.0" 401 2193 domain.de "-" "ia_archiver" "-"
209.237.238.235 - - [30/May/2006:03:58:01 +0200] "GET /logs/access.log.20.6 HTTP/1.0" 401 2193 domain.de "-" "ia_archiver" "-"
209.237.238.235 - - [30/May/2006:03:58:14 +0200] "GET /logs/access.log.20.7 HTTP/1.0" 401 2193 domain.de "-" "ia_archiver" "-"
209.237.238.235 - - [30/May/2006:03:58:26 +0200] "GET /logs/access.log.16.gz HTTP/1.0" 401 2193 domain.de "-" "ia_archiver" "-"
209.237.238.235 - - [30/May/2006:03:58:45 +0200] "GET /logs/access.log.19.gz HTTP/1.0" 401 2193 domain.de "-" "ia_archiver" "-"
209.237.238.235 - - [30/May/2006:03:58:59 +0200] "GET /logs/access.log.20.1.gz HTTP/1.0" 401 2193 domain.de "-" "ia_archiver" "-"
209.237.238.235 - - [30/May/2006:03:59:12 +0200] "GET /logs/access.log.20.2.gz HTTP/1.0" 401 2193 domain.de "-" "ia_archiver" "-"