Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

grabber und agressive spider block

Ajax, Hijax, Microformats, RDF, Markup, HTML, PHP, CSS, MySQL, htaccess, robots.txt, CGI, Java, Javascript usw.
Neues Thema Antworten
Noki
PostRank 7
PostRank 7
Beiträge: 639
Registriert: 16.05.2003, 22:27
Wohnort: Gernsbach

Beitrag von Noki » 23.09.2004, 11:18

Hallo,

heute Nacht wurde mal wieder eine meiner Seiten komplett gegrabbt. Langsam wird mir das echt zu blöd und ich überlege seit längerem eine Grabber und Agressive Spider Falle zu bauen. Vielleicht hat ja schon jemand so etwas programmiert, dan kann ich mir die ganze Arbeit spaaren. Oder es hat jemand Interesse mitzuwirken. Wie folgt stelle ich mir das vor:

Bei jedem Seitenaufruf wird die IP in eine Datenbank geschrieben und es wird überprüft wie oft die IP innerhalb der letzten 5 Minuten auf den Server zugegriffen hat. Wenn die IP weniger als XX Zugriffe produziert hat wird der Zugriff erlaubt, ansonsten wandert die IP in eine Blacklist falls sie nicht in einer Whitelist steht.

Ich denke mal das große Suchmaschinen ja mit ganzen IP-Blöcken auftreten und somit ja nie in eine solche Falle treten. Grabber jedoch tun dies in der Regel mit einer IP und greifen enorm schnell die Seiten ab und man könnte diesem abnormen Surfverhalten schon nach 50 oder 100 PI's einen Riegel vorschieben.

Kommentare und Quelltexte erwünscht ;)

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


SISTRIX
PostRank 9
PostRank 9
Beiträge: 1255
Registriert: 01.09.2003, 20:57
Wohnort: Bonn

Beitrag von SISTRIX » 23.09.2004, 11:41

Hi,

habe sowas im Einsatz. Für gewollte Crawler allerdings eine Whitelist.
Den Code kann ich leider nicht rausgeben, ist aber eine Sache von weniger als 30 Minuten das zu schreiben.

Gruss Johannes
SISTRIX Suchmaschinen Blog
SEO- und SEM-Tools: [url=httpss://tools.sistrix.de/toolbox/?tid=lnk_foren_abk]SISTRIX Toolbox[/url]
Linktausch für PR9 und 10 gesucht!

Noki
PostRank 7
PostRank 7
Beiträge: 639
Registriert: 16.05.2003, 22:27
Wohnort: Gernsbach

Beitrag von Noki » 23.09.2004, 12:01

jo, ist nicht so aufwändig - aber wenn sowas bereits jemand geschrieben hat muss ich das Rad ja nicht erst neu erfinden... ;)

bull
PostRank 9
PostRank 9
Beiträge: 2166
Registriert: 20.09.2003, 20:57
Wohnort: Vèneto

Beitrag von bull » 23.09.2004, 12:51


Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag