Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

adshadow.de aussperren?

Alles zum Thema: Robots, Spider, Logfile-Auswertung und Reports
webpilot
PostRank 6
PostRank 6
Beiträge: 417
Registriert: 24.03.2007, 17:03

Beitrag von webpilot » 09.07.2008, 10:44

Meine Anfrage nach der Browserkennung, der IP oder sowas des Bots, wurde von AdFire nicht beantwortet. Weiss jemand wie der Bot auftritt?

Gruss.

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


Keyser Soze
PostRank 9
PostRank 9
Beiträge: 1414
Registriert: 07.09.2004, 08:58

Beitrag von Keyser Soze » 05.08.2008, 08:59

https://everflux.de/adsense-ruckwartssuc ... hadow-597/
Ich empfehle, zu noch härteren Maßnahmen zu greifen, da es Null Reaktion und Kooperationsbereitschaft gibt. Z.B. für jede Anfrage 10x "zurückfeuern" oder einen Anwalt einschalten und auf Löschung der eigenen Daten dringen.
Zuletzt geändert von Keyser Soze am 05.08.2008, 09:05, insgesamt 1-mal geändert.

webpilot
PostRank 6
PostRank 6
Beiträge: 417
Registriert: 24.03.2007, 17:03

Beitrag von webpilot » 05.08.2008, 09:04

Danke! Adfire hat es leider nicht nötig, auf eMailanfragen zu antworten.

Dazu eine Frage:

Kann man in den robots.txt auch * als Wildcard verwenden? z.B. so:

Code: Alles auswählen

penthesilea *

Keyser Soze
PostRank 9
PostRank 9
Beiträge: 1414
Registriert: 07.09.2004, 08:58

Beitrag von Keyser Soze » 05.08.2008, 09:05

Sperre sowohl UserAgent, als auch IPs direkt per htaccess. Wer bei Kontaktanfragen "meine Name ist Hase" spielt, wird sich wahrscheinlich auch nicht an die robots.txt halten.

Nutzer0815
PostRank 9
PostRank 9
Beiträge: 1545
Registriert: 26.03.2008, 15:13
Wohnort: Mountain View (Kalifornien)

Beitrag von Nutzer0815 » 05.08.2008, 09:50

kann einer mal die IPs und so posten ? und wie so ne htaccess Datei aussehen muss ?

webpilot
PostRank 6
PostRank 6
Beiträge: 417
Registriert: 24.03.2007, 17:03

Beitrag von webpilot » 05.08.2008, 09:54

Code: Alles auswählen

Order deny,allow
Deny from 000.000.000.000
IP kenne ich leider nicht. Der gute Airport1 kennt die sicher. :D

Edit: https://www.abakus-internet-marketing.de ... -3931.html

Keyser Soze
PostRank 9
PostRank 9
Beiträge: 1414
Registriert: 07.09.2004, 08:58

Beitrag von Keyser Soze » 05.08.2008, 10:29

Ich kenne die IPs des Bots leider auch nicht. In vorauseilendem Gehorsam habe ich allerdings gleich mal die IP der Domain gesperrt (ein Strato-Server). Ob auch der Bot von dieser IP kommt, weiß ich nicht. Müsse ich mal meine Logs analysieren, was sehr aufwändig wird, weil der Bot ja wahrscheinlich nicht täglich vorbeischaut.
Bei der Google-Suche nach "penthesilea" habe ich in einer Webalizer-Auswertung einer Uni-Domain aber noch gefunden, dass der Bot sich dort offenbar zusätzlich auch ein paar Mal als UserAgent "AdShadow" ausgegeben hat.

Ein Tipp von mir:

Code: Alles auswählen

RewriteCond %{REQUEST_URI} !^/robots\.txt$ [NC]
RewriteCond %{HTTP_USER_AGENT} ^.*penthesilea.*
RewriteRule ^.*$ - [F,L]
So haben die Bots wenigstens noch die Chance, die robots.txt zu lesen und sich daran zu halten (=weniger Load für den Server, falls sie das tun).

bara.munchies
PostRank 9
PostRank 9
Beiträge: 2457
Registriert: 09.06.2005, 09:02
Wohnort: Krung Tep

Beitrag von bara.munchies » 05.08.2008, 10:38

penthesilea ist korrekt.

Keyser Soze
PostRank 9
PostRank 9
Beiträge: 1414
Registriert: 07.09.2004, 08:58

Beitrag von Keyser Soze » 05.08.2008, 10:43

Ok, ein cat *.log | grep 'penthesilea' > spammer.txt hat ergeben, dass der Typ das Teil daheim auf seinem PC laufen lässt. Ganz schön arm :lol:
p4fde3c1c.dip.t-dialin.net - - [01/Jul/2008:15:50:00 +0200] "GET /robots.txt HTTP/1.0" 200 208 "https://www.meinedomain.de" "Mozilla/5.0 (compatible; penthesilea/0.3 +https://85.214.24.208)"
p4fde3c1c.dip.t-dialin.net - - [01/Jul/2008:15:50:03 +0200] "GET /XXX.php HTTP/1.0" 200 817 "https://www.meinedomain.de/" "Mozilla/5.0
(compatible; penthesilea/0.3 +https://85.214.24.208)"
p4fde7161.dip.t-dialin.net - - [23/Jul/2008:00:20:03 +0200] "GET /XXX.html HTTP/1.0" 200 9623 "https://www.meinedomain.de/" "Mozilla
/5.0 (compatible; AdShadow +https://adshadow.de)"
p4fde7161.dip.t-dialin.net - - [23/Jul/2008:00:20:09 +0200] "GET /XXX.html HTTP/1.0" 200 7965 "https://www.meinedomain.de/" "M
ozilla/5.0 (compatible; AdShadow +https://adshadow.de)"
p4fde7161.dip.t-dialin.net - - [23/Jul/2008:00:20:14 +0200] "GET /XXX.html HTTP/1.0" 200 11201 "https://www.meinedomain.de/" "Moz
illa/5.0 (compatible; AdShadow +https://adshadow.de)"
p4fde7b93.dip.t-dialin.net - - [29/Jul/2008:08:02:08 +0200] "GET /robots.txt HTTP/1.0" 200 1971 "https://www.meinedomain.de/" "Mozilla/5.0 (c
ompatible; AdShadow +https://adshadow.de)"
p4fde7b93.dip.t-dialin.net - - [29/Jul/2008:08:02:13 +0200] "GET / HTTP/1.0" 403 3057 "-" "Mozilla/5.0 (compatible; AdShadow +https://ad
shadow.de)"
p4fde54a5.dip.t-dialin.net - - [28/Jul/2008:22:51:09 +0200] "GET /robots.txt HTTP/1.0" 200 1971 "https://www.meinedomain.de/" "Mozi
lla/5.0 (compatible; AdShadow +https://adshadow.de)"
p4fde54a5.dip.t-dialin.net - - [28/Jul/2008:22:51:15 +0200] "GET / HTTP/1.0" 403 3057 "-" "Mozilla/5.0 (compatible; AdShadow +https://ad
shadow.de)"
Die robots.txt wird gelesen - es besteht also Grund zur Hoffnung.
Wie ich des Weiteren an den 403ern sehe, wird der Bot schon seit Ende Juli von der Bot-Trap geblockt. Sehr schön Bild

webpilot
PostRank 6
PostRank 6
Beiträge: 417
Registriert: 24.03.2007, 17:03

Beitrag von webpilot » 05.08.2008, 12:56

Keyser Soze hat geschrieben:Wie ich des Weiteren an den 403ern sehe, wird der Bot schon seit Ende Juli von der Bot-Trap geblockt. Sehr schön Bild
:wave:

Prima Sache. Danke für die Info.

Ice Man
PostRank 9
PostRank 9
Beiträge: 2477
Registriert: 04.06.2003, 19:16

Beitrag von Ice Man » 05.08.2008, 14:05

für was soll adshadow.de eigentlich gut sein ?

Burns
PostRank 5
PostRank 5
Beiträge: 296
Registriert: 10.06.2008, 18:54

Beitrag von Burns » 05.08.2008, 16:45

adshadow speichert zanox-, Analytics-, Affili.net und AdSense-IDs einer gespiderten Webseite. Sucht man nach einer solchen ID kann man ersehen welche Webseiten so alles zu einem Account gehören.

Muss ja nich sein finde ich.
Mit Datenschutz hat das nichts zu tun

Seo
PostRank 9
PostRank 9
Beiträge: 1709
Registriert: 19.07.2005, 17:14

Beitrag von Seo » 06.08.2008, 09:24

Ice Man hat geschrieben:für was soll adshadow.de eigentlich gut sein ?
Der Beitreiber und seine Freunde werden es sicher wissen. 0X

everflux
PostRank 8
PostRank 8
Beiträge: 939
Registriert: 01.05.2006, 17:15

Beitrag von everflux » 09.08.2008, 10:05

Ich bin eben über diesen Kommentar gestolpert:
https://seo-news.de/archives/2008/08/04/ ... eintraegen

Das ist fast so gut wie eine Antwort auf E-Mails ;-)
Jedenfalls ist damit dann wohl klar, dass sich die Suchmaschine korrekt verhält, und man als Webmaster Einfluß hat.
https://everflux.de/ blogging about life, programming, seo and the net

Burns
PostRank 5
PostRank 5
Beiträge: 296
Registriert: 10.06.2008, 18:54

Beitrag von Burns » 09.08.2008, 10:15

meine ID's geht niemanden etwas an und wenn sich jemand dafür interessiert, kann kein guter Gedanke dahinter stehen.

Ich hab den Bot ausgesperrt und das bleibt auch so

Antworten