Ich habe mir eine .htaccess-Datei gebastelt, um zumindest einige unliebsame Bots auszusperren. Mir ist klar, dass ich damit nicht alle "bad bots" erwische, aber ich habe keine Lust auf eine bot-trap und will auch nicht ständig meine .htaccess-Datei pflegen u. aktualisieren müssen. Es soll eine einfache Lösung mit (bekanntermaßen) begrenzter Wirksamkeit sein.
Wichtig ist mir nur, dass nur bots/spider/crawler ausgesperrt werden.
Folgender Code soll alle Zugriffe mit "spider", "bot" und "crawler" aussperren, ausser Google, MSN, Yahoo und DMOZ. Robots.txt bleibt immer lesbar.
Code: Alles auswählen
RewriteCond %{HTTP_USER_AGENT} ^.*spider.*$ [NC,OR]
RewriteCond %{HTTP_USER_AGENT} ^.*bot.*$ [NC,OR]
RewriteCond %{HTTP_USER_AGENT} ^.*crawl.*$ [NC]
RewriteCond %{HTTP_USER_AGENT} !(msnbot|googlebot|Robozilla|slurp) [NC]
RewriteRule !robots.txt robots.txt [C]
RewriteRule ^.*$ - [F,L]
Gruß Yoogler