Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Spider GONZO1 ??

Alles zum Thema: Robots, Spider, Logfile-Auswertung und Reports
Neues Thema Antworten
redcan
PostRank 4
PostRank 4
Beiträge: 159
Registriert: 25.04.2005, 13:25

Beitrag von redcan » 31.10.2005, 13:00

hallo zusammen,

kennt jemand den spider?
angeblich t-info.telekom.de, aber ip ist vom online dienst niederbayern

refferer "gonzo1 mailto:crawleradmin.t-info@telekom.de"

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


ckl
PostRank 5
PostRank 5
Beiträge: 267
Registriert: 05.08.2005, 17:55

Beitrag von ckl » 31.10.2005, 15:29

Ist kein böser Bot - habe auch vor ein paar Tagen einen Tread eröffnet.
Der Bot speidert nur Deine Bilder, stimmts

redcan
PostRank 4
PostRank 4
Beiträge: 159
Registriert: 25.04.2005, 13:25

Beitrag von redcan » 31.10.2005, 17:47

nein, nur seiten aber reffer von telekom über ip von online dienst niederbayern ??

DirkBl
PostRank 1
PostRank 1
Beiträge: 9
Registriert: 01.11.2005, 08:08
Wohnort: Hamburg

Beitrag von DirkBl » 01.11.2005, 08:11

Das Ding gehört zu t-info.de, ist vielleicht nicht gefährlich, aber super lästig.....
Deshalb hier die Antwort des Crawleradmin:

Sehr geehrter Herr xxx,

um Zugriffe durch den Crawler auf Ihrer kompletten Site auszuschließen verwenden Sie bitte folgende Einträge:

User-agent: gonzo1
User-agent: gonzo2
User-agent: gonzo1P
User-agent: gonzo2P
Disallow: /


Mit freundlichen Grüßen,

Matthias Waltenberger

t-info GmbH
Dingolfinger Straße 1-15
81673 München

Tel. +49-89-59946-520
Fax +49-941-599299-123
Mail matthias.waltenberger@telekom.de


-----Ursprüngliche Nachricht-----
Von:
Gesendet: Donnerstag, 20. Oktober 2005 11:28
An: crawleradmin t-info
Betreff: Useragent?


Sehr geehrte Damen und Herren,

welchen Useragent muss ich in die robot.txt für Ihren Crawler eintragen, um Zugriffe auf unsere Site auszuschliessen?

redcan
PostRank 4
PostRank 4
Beiträge: 159
Registriert: 25.04.2005, 13:25

Beitrag von redcan » 01.11.2005, 09:57

super, danke für die info !!!

bull
PostRank 9
PostRank 9
Beiträge: 2166
Registriert: 20.09.2003, 20:57
Wohnort: Vèneto

Beitrag von bull » 07.11.2005, 07:31

Der Betreiber ist nach eigenem Bekunden dabei,
eine neue Spezialsuchmaschine zu erproben, die in einigen Monaten live gehen wird - dann können wir Ihnen auch gerne nähere Informationen dazu geben.

Southmedia
PostRank 10
PostRank 10
Beiträge: 7322
Registriert: 20.07.2003, 19:56

Beitrag von Southmedia » 12.11.2005, 02:40

Das ist aber nicht nett, ich würde gerne jetzt wissen wozu der Bot hier die ganze Zeit auf meinen Domains rumrödelt.

ckl
PostRank 5
PostRank 5
Beiträge: 267
Registriert: 05.08.2005, 17:55

Beitrag von ckl » 12.11.2005, 13:38

Also ich bin nach wie vor der Meinung, daß die versuchen eine Bilderdatenbank aufzubauen. Hatte in einem anderen Tread auch die Prob., daß Gonzo sehr stark auf meine Bilder aus war.....die haben Ihm so gefallen, daß er ganz und gar nicht mehr nach Hause wollte :lol:

Bubo
PostRank 1
PostRank 1
Beiträge: 9
Registriert: 21.02.2006, 14:56
Wohnort: Düsseldorf

Beitrag von Bubo » 21.02.2006, 15:05

Hallo Leute,
seit heute nervt mich dieser Gonzo ziemlich heftig. :evil:

Eure Vermutung mit der Bilddatenbank könnte richtig sein, wir betreiben eine ziemlich grosse Fotohomepage - da gibt es einiges zu spidern :-?

Leider stört er sich nicht an der robots.txt, also habe ich ihn in die .htaccess aufgenommen. Das stört ihn auch nicht :o

Also ist wahrscheinlich irgendetwas an meiner Syntax falsch. Könntet Ihr mal einen Blick darauf werfen und mir einen Tip geben?

Momentan sperre ich ihn über seine IP aus, ist zum Glück (bisher!) immer dieselbe.

Hier der Auszug aus dem Logfile:

Code: Alles auswählen

212.34.175.72 - - [21/Feb/2006:09:22:00 +0100] "GET /xxxx.php HTTP/1.1" 200 5172 "http://www.url.de" "gonzo1[P] mailto:crawleradmin.t-info@telekom.de"
In der .htaccess habe ich dann folgendes eingefügt:

Code: Alles auswählen

.......
RewriteCond %{HTTP_USER_AGENT} ^gonzo1[P]\ mailto:crawleradmin.t-info@telekom.de [OR]
.......
Probiert - ohne Erfolg - habe ich auch folgendes:

Code: Alles auswählen

.......
RewriteCond %{HTTP_USER_AGENT} ^gonzo1[P]\ (mailto:crawleradmin.t-info@telekom.de) [OR]
...........
Das hier funktioniert über Wannabrowser, aber lt. Logfile kommt er immer noch wieder durch:

Code: Alles auswählen

.......
RewriteCond %{HTTP_USER_AGENT} ^gonzo1 [OR]
...........
Vielen Dank vorab für Eure Hilfe!
LG
Sandra
Zuletzt geändert von Bubo am 21.02.2006, 16:14, insgesamt 1-mal geändert.

marc75
PostRank 9
PostRank 9
Beiträge: 1916
Registriert: 06.10.2004, 09:36

Beitrag von marc75 » 21.02.2006, 15:44

Das ist aber nicht nett, ich würde gerne jetzt wissen wozu der Bot hier die ganze Zeit auf meinen Domains rumrödelt.
In einem anderen Forum hatte ich im letzten Jahr mal gelesen das der Bot ein Index aufbauen soll, ähnlich google, bzw. etwas spezialisiert.

Chris2005
PostRank 9
PostRank 9
Beiträge: 1284
Registriert: 14.04.2005, 23:58

Beitrag von Chris2005 » 21.02.2006, 17:28

Probiere mal

Code: Alles auswählen

RewriteCond %{HTTP_USER_AGENT} gonzo [OR,NC] 
sollte helfen...

Gruss
Chris

Bubo
PostRank 1
PostRank 1
Beiträge: 9
Registriert: 21.02.2006, 14:56
Wohnort: Düsseldorf

Beitrag von Bubo » 22.02.2006, 07:14

Vielen Dank!

Die letzte Variante, die per Wannabrowser bereits funktioniert hat, hat dann nach ca. 45 Minuten auch bei Gonzo01 funktioniert.

Ist so eine Zeitverzögerung normal?

Wenn ich z.b. einen Typo in der .htaccess habe, bekomme ich sofort nach Hochladen einen Internal Server Error - da gibt es offensichtlich keine Zeitverzögerung.

Mannomann, als ich die Homepage vor einem Jahr auf die Beine gestellt habe, hätte ich nie gedacht, dass die Administration so in die Zeit geht! :o

LG
Sandra

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag