Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Erfahrungswerte mit Bot-Trap Fallen?

Ajax, Hijax, Microformats, RDF, Markup, HTML, PHP, CSS, MySQL, htaccess, robots.txt, CGI, Java, Javascript usw.
Neues Thema Antworten
Airport1
PostRank 10
PostRank 10
Beiträge: 4489
Registriert: 16.08.2004, 18:50
Wohnort: Backnang / bei Stuttgart

Beitrag von Airport1 » 15.06.2006, 10:23

Habe jetzt mal so eine ganz simple Bot-Trap auf einer meiner Domains eingebaut, das Ergebnis sieht bislang wie folgt aus:

14.06.2006 21:21:06 - 213.63.21.45 213-63-21-45.dsl.net.artelecom.pt - Mozilla/4.0 (compatible; MSIE 7.0b; Windows NT 6.0)
14.06.2006 22:17:51 - 82.135.148.147 82.135.148.147 - Java/1.4.1_04
15.06.2006 03:21:22 - 203.80.209.253 203080209253.ctinets.com -
15.06.2006 03:30:47 - 65.60.93.50 65-60-93-50-cust.telepacific.net - Java/1.4.1_04
15.06.2006 04:34:14 - 145.253.94.146 145.253.94.146 -
15.06.2006 05:07:55 - 212.222.51.22 212.222.51.22 - eBay Relevance Ad Crawler powered by contentDetection (www.mindup.de)
15.06.2006 07:32:55 - 203.199.72.210 203.199.72.210.static.vsnl.net.in - Java/1.5.0_05
15.06.2006 07:54:27 - 203.199.72.210 203.199.72.210.static.vsnl.net.in - Java/1.5.0_05
15.06.2006 10:19:20 - 58.88.205.49 p3049-ipad205sizuokaden.shizuoka.ocn.ne.jp - Mozilla/4.0 (compatible; MSIE 6.0; Windows 98)

Was mich nun etwas wundert, dass man haeufiger Java als User Agent antrifft, und sehr oft IPs aus China, Japan, oder den Oststaaten des zerfallenen Russia dabei sind, aber auch der eBay Relevance Ad Crawler.. kann jemand die Ergebnisse etwas besser deuten?
Linktauschanfragen zwecklos
https://www.bot-trap.de/ Spamschutz fuer Webmaster - zentrale Meldestelle fuer Web Spam
https://www.airport1.de/blog/ Lombagruschd Blog mid Gardadierle
https://www.ranking-hits.de/ Counter & PR Service

Anzeige von ABAKUS

von Anzeige von ABAKUS »

Content Erstellung von ABAKUS Internet Marketing
Ihre Vorteile:
  • einzigartige Texte
  • suchmaschinenoptimierte Inhalte
  • eine sinnvolle Content-Strategie
  • Beratung und Umsetzung
Jetzt anfragen: 0511 / 300325-0

SloMo
PostRank 10
PostRank 10
Beiträge: 4880
Registriert: 04.01.2005, 18:26

Beitrag von SloMo » 15.06.2006, 10:31

Wie sieht denn die robots.txt aus?

Die Java-Clients habe ich immer so gedeutet, dass da irgend welche Java-Baster einen Crawler gebaut haben, und dabei auf irgend welche Standardklassen zurückgreifen. Darüber weißt Du bestimmt besser als ich bescheid.

Airport1
PostRank 10
PostRank 10
Beiträge: 4489
Registriert: 16.08.2004, 18:50
Wohnort: Backnang / bei Stuttgart

Beitrag von Airport1 » 15.06.2006, 10:58

die robots.txt sollte da unmissverstaendlich sein:

User-agent: *
Disallow: /bot-trap/

oder sollte der trailing slash weg?
Linktauschanfragen zwecklos
https://www.bot-trap.de/ Spamschutz fuer Webmaster - zentrale Meldestelle fuer Web Spam
https://www.airport1.de/blog/ Lombagruschd Blog mid Gardadierle
https://www.ranking-hits.de/ Counter & PR Service