Seite 1 von 3

Useragent 'Twiceler'

Verfasst: 14.05.2007, 12:41
von codemonk
Seit ein paar Tagen werden zwei meiner Sites von hier

38.99.13.126 - Mozilla/5.0 (Twiceler-0.9 https://www.cuill.com/twiceler/robot.html)

massiv gespidert.

Forums- und Googlesuche bringen nix Informatives. Auf der Root wird man durch eine Passbox begrüsst.

Ist dieser UA jemanden bekannt? Schonmal negativ aufgefallen?

Verfasst:
von

Hochwertiger Linkaufbau bei ABAKUS:
  • Google-konformer Linkaufbau
  • nachhaltiges Ranking
  • Linkbuilding Angebote zu fairen Preisen
  • internationale Backlinks
Wir bieten Beratung und Umsetzung.
Jetzt anfragen: 0511 / 300325-0

Verfasst: 16.05.2007, 10:08
von Alex1007
Hallo,

auch meine Seiten werden von dieser IP schon seit mehreren Tagen wie wild gespidert! Diese IP wird mir nur angezeigt: 38.99.13.126

hat jemand eine Ahnung, woher diese IP kommt??

twicler robot

Verfasst: 16.05.2007, 11:14
von torro
Kuck mal hier:
https://www.cuill.com/twiceler/robot.html

Auf die Startseite kommt man nicht rauf, aber man sagt 'Twiceler should obey robots.txt.'.

Registriert ist die Domain auf Tom Costello mit einer Email Adresse @cs.stanford.edu.

Verfasst:
von
SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


Verfasst: 16.05.2007, 15:42
von michaa
Ist möglicherweise dieser hier:

https://www-formal.stanford.edu/tjc/

Re: twicler robot

Verfasst: 21.05.2007, 14:03
von av3nger
torro hat geschrieben:Auf die Startseite kommt man nicht rauf, aber man sagt 'Twiceler should obey robots.txt.'
Dann müsste ich die doch theoretisch per

User-agent: Twiceler
Disallow: /

aussperren können, oder etwa nicht?

Re: twicler robot

Verfasst: 21.05.2007, 14:05
von net(t)worker
av3nger hat geschrieben:
torro hat geschrieben:Auf die Startseite kommt man nicht rauf, aber man sagt 'Twiceler should obey robots.txt.'
Dann müsste ich die doch theoretisch per

User-agent: Twiceler
Disallow: /

aussperren können, oder etwa nicht?

ne.. so sperrst du ihn nicht wirklich aus, so bittest du ihn fernzubleiben... ob er es dann macht ist was anderes...

Verfasst: 21.05.2007, 14:21
von SloMo
Da hat net(t)worker Recht. Um Ihn auszusperren, bräuchte man schon eine passende .htaccess oder ein paar Zeilen PHP-Code. Wie das im Einzelfall geht, wird ja an diversen Stellen hier im Forum ausführlich beschrieben (Suchfunktion benutzen) ;)

Re: twicler robot

Verfasst: 21.05.2007, 14:45
von av3nger
net(t)worker hat geschrieben:ne.. so sperrst du ihn nicht wirklich aus, so bittest du ihn fernzubleiben... ob er es dann macht ist was anderes...
Jo, deswegen sagte ich auch "theoretisch". Also wenn er die befolgen würde, was ja auf der Seite behauptet wird.

Also müsste ich es am Besten mit

RewriteCond %{HTTP_USER_AGENT} Twiceler
RewriteRule ^.* - [F]

lösen, oder?

Verfasst: 01.11.2007, 16:13
von mgutt
Ich habe gerade mal meine 404 Ergebnisse analysiert. Der Twiceler produziert total falsche URLs. Er kombiniert scheinbar 2 verschiedene und macht daraus eine, die dann gar nicht gehen kann.

Dann steht da durchaus mal:

domain.com/index.htmldomain2.com/index.html

Total Banane. Wofür ist dieser Bot wichtig?

Gleiche Probleme habe ich mit Baiduspider.

Der macht gerne mal: ("hdsunds" sind immer zufällig und anders und existieren nicht)
domain.com/hdsunds/index.html

Oder hier der MSN Bot kann das auch: ("popular/development" gibts nicht)
domain.de/popular/index.html (Method: GET) (Agent: msnbot/1.0 (+https://search.msn.com/msnbot.htm)) (Ref: domain.de/popular/development)

Hat jemand ähnliche Erfahrungen? Ich frage mich wie die Bots auf solche URLs kommen.

Gruß
Marc

Verfasst: 28.07.2008, 09:22
von Keyser Soze

Verfasst: 28.07.2008, 11:04
von Burns
per .htaccess gesperrt und Ruhe is.
Spider von Suchmaschinen die keine Besucher bringen oder sonst nichts nutzen werden von mir immer gleich gesperrt.

Der Spider gibt sich ja zumindes zu erkennen.

-

Verfasst: 28.07.2008, 14:37
von pr_sniper
:D welcher Webmaster sperrt Suchmaschinenbots aus und verzichtet so auf Suchergebnisse, Besucher und Umsatz? - Blödsinn.

Ansonsten wie bisher durch wenige erkannt: https://www.google.com/search?hl=de&q=Cuil

Verfasst: 28.07.2008, 16:45
von Keyser Soze
Das sind die gleichen Leute, die sich im nächsten Thread wieder über die Dominanz von Google beschweren... :roll:

Verfasst: 28.07.2008, 18:15
von hypnos
Bin gespannt was das sein soll. Hätte beinahe die grösste Suchmaschine ausgesperrt :D

man schon

Verfasst: 28.07.2008, 19:10
von robel
Um Ihn auszusperren, bräuchte man schon eine passende .htaccess oder ein paar Zeilen PHP-Code. Wie das im Einzelfall geht, wird ja an diversen Stellen hier im Forum ausführlich beschrieben