Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

WGet gesperrt - evtl. keine gute Idee?

Alles zum Thema: Robots, Spider, Logfile-Auswertung und Reports
Neues Thema Antworten
sunside
PostRank 1
PostRank 1
Beiträge: 1
Registriert: 27.09.2007, 15:53

Beitrag von sunside » 27.09.2007, 15:57

Hallo,

ich habe alle User-Agents mit "wget/" geblockt. Nun habe ich gesehen, dass sich ein User Agent als
Wget/1.10.2 (Red Hat modified)
identifiziert, der von der IP 68.180.251.16 kommt. Das ist llf310004.crawl.yahoo.net

Wenn ich diesem Crawler also eine Fehlermeldung präsentiere, könnte der das als Cloaking missverstehen? Sollte ich den Filter auf wget dann löschen?

Ich finde aber eigentlich, der soll sich dann irgendwie anders identifizieren.

Danke und viele Grüsse

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


thekaine
PostRank 1
PostRank 1
Beiträge: 18
Registriert: 20.07.2007, 11:52

Beitrag von thekaine » 28.09.2007, 13:31

Naja ist halt die Frage wie viel Wert du auf Yahoo legst. Da Problem besteht halt immer wenn Leute sich nicht an Regelungen halten. Alternativ könntest du ja auch whitelists anlegen in denen du zb alle Anfragen von *.yahoo.net erlaubst :). Das ist aber ggf sehr aufwändig.

Würde mir auch überlegen warum du den überhaupt blocken magst und was der wget da so "schlimmes" machen kann. Datenklauer kommen auch über andere Wege als WGET =)

Airport1
PostRank 10
PostRank 10
Beiträge: 4489
Registriert: 16.08.2004, 18:50
Wohnort: Backnang / bei Stuttgart

Beitrag von Airport1 » 28.09.2007, 14:01

die ganze script kiddie armada nutzt wget.. verstehe nicht warum yahoo den ploetzlich benutzen sollte.. ergibt irgendwie keinen sinn. eine so halbwegs grosse suma sollte sich ANSTAENDIG und vor allem SELBSTBESCHREIBEND "outen", und sich nihct hinter einem ominoesen wget verstecken..
Linktauschanfragen zwecklos
https://www.bot-trap.de/ Spamschutz fuer Webmaster - zentrale Meldestelle fuer Web Spam
https://www.airport1.de/blog/ Lombagruschd Blog mid Gardadierle
https://www.ranking-hits.de/ Counter & PR Service

grossy
PostRank 6
PostRank 6
Beiträge: 477
Registriert: 21.07.2007, 17:55

Beitrag von grossy » 28.09.2007, 15:04

Die script-kiddies sind aber auch nich doof, und wenn die Deine Seite wollen, is es nicht so schwer ein --user-agent="Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.8.1.3) Gecko/20070309 Firefox/2.0.0.3" hinter das wget zu setzen.

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag