Semi-automatische Bot-Sperre per .htaccess
Verfasst: 26.07.2006, 16:00
Hi.
Ich habe mir eine .htaccess-Datei gebastelt, um zumindest einige unliebsame Bots auszusperren. Mir ist klar, dass ich damit nicht alle "bad bots" erwische, aber ich habe keine Lust auf eine bot-trap und will auch nicht ständig meine .htaccess-Datei pflegen u. aktualisieren müssen. Es soll eine einfache Lösung mit (bekanntermaßen) begrenzter Wirksamkeit sein.
Wichtig ist mir nur, dass nur bots/spider/crawler ausgesperrt werden.
Folgender Code soll alle Zugriffe mit "spider", "bot" und "crawler" aussperren, ausser Google, MSN, Yahoo und DMOZ. Robots.txt bleibt immer lesbar.
Was haltet ihr davon? Optimierungsvorschläge? Kritik? Mögliche Probleme??
Gruß Yoogler
Ich habe mir eine .htaccess-Datei gebastelt, um zumindest einige unliebsame Bots auszusperren. Mir ist klar, dass ich damit nicht alle "bad bots" erwische, aber ich habe keine Lust auf eine bot-trap und will auch nicht ständig meine .htaccess-Datei pflegen u. aktualisieren müssen. Es soll eine einfache Lösung mit (bekanntermaßen) begrenzter Wirksamkeit sein.
Wichtig ist mir nur, dass nur bots/spider/crawler ausgesperrt werden.
Folgender Code soll alle Zugriffe mit "spider", "bot" und "crawler" aussperren, ausser Google, MSN, Yahoo und DMOZ. Robots.txt bleibt immer lesbar.
Code: Alles auswählen
RewriteCond %{HTTP_USER_AGENT} ^.*spider.*$ [NC,OR]
RewriteCond %{HTTP_USER_AGENT} ^.*bot.*$ [NC,OR]
RewriteCond %{HTTP_USER_AGENT} ^.*crawl.*$ [NC]
RewriteCond %{HTTP_USER_AGENT} !(msnbot|googlebot|Robozilla|slurp) [NC]
RewriteRule !robots.txt robots.txt [C]
RewriteRule ^.*$ - [F,L]
Gruß Yoogler