Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Hoher Traffic von Wget

Alles zum Thema: Robots, Spider, Logfile-Auswertung und Reports
Neues Thema Antworten
hagbart
PostRank 1
PostRank 1
Beiträge: 26
Registriert: 23.10.2004, 11:50
Wohnort: Köln

Beitrag von hagbart » 23.10.2004, 12:00

Hallo,
als ich gestern meine Stats angesehen hab, hatte ich plötzlich ein "Verkehrsaufkommen" von 7000 Besuchen. Normal waren bei mir allerdings so 500-700 Besucher pro Tag. In der Statistik hab ich rausgefunden, dass der Übeltäter Wget war mit über 6000 Zugriffen. Ich hab keine Ahnung was dieses Programm von mir will. Hat jemand ne Ahnung warum das Programm so häufig meine Seite besucht hat ?

Anzeige von ABAKUS

von Anzeige von ABAKUS »


Hochwertiger Linkaufbau bei ABAKUS:
  • Google-konformer Linkaufbau
  • nachhaltiges Ranking
  • Linkbuilding Angebote zu fairen Preisen
  • internationale Backlinks
Wir bieten Beratung und Umsetzung.
Jetzt anfragen: 0511 / 300325-0

bull
PostRank 9
PostRank 9
Beiträge: 2166
Registriert: 20.09.2003, 20:57
Wohnort: Vèneto

Beitrag von bull » 23.10.2004, 12:09

https://www.gnu.org/software/wget/wget.html

Da hat jemand oder mehrere Deine komplette Seite (wenigstens aber einen Teil) heruntergeladen. Sogenannte Offline-Browser wie eben Wget, Teleport Pro, HTTrack, Website Copier etc. sind nichts anderes als Programme, welche eine lokale Kopie einer Website auf der Festplatte des Benutzers erzeugen.
Es finden sich in diesem Forum Mittel und Wege, wie man dies unterbinden kann.

hagbart
PostRank 1
PostRank 1
Beiträge: 26
Registriert: 23.10.2004, 11:50
Wohnort: Köln

Beitrag von hagbart » 23.10.2004, 12:12

Das hab ich mir auch schon gedacht aber mit über 6000 Zugriffen ? Oder Spidern die auch einfach durchs Netz ? Wenn ja wie sind die dann auf meine Seite mit so hoher Anzahl gekommen ? So viele links verweisen gar nicht auf mich.

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


bull
PostRank 9
PostRank 9
Beiträge: 2166
Registriert: 20.09.2003, 20:57
Wohnort: Vèneto

Beitrag von bull » 23.10.2004, 12:16

Vielleicht hat der Verursacher auch gemeint, Deine Seite mehrmals spidern zu wollen (in der Hoffnung, mehr zu finden), aber diese Fragen kann Dir nur ein Blick in Deine Logdateien beantworten (nicht irgeneinem Statistikprogramm vertrauen).
Sofern Du keinen Zugriff auf "raw logs" (in der Regel im Ordner /logs/) hast, empfehle ich dringend, den Anbieter zu wechseln.

hagbart
PostRank 1
PostRank 1
Beiträge: 26
Registriert: 23.10.2004, 11:50
Wohnort: Köln

Beitrag von hagbart » 23.10.2004, 12:26

Danke check ich gleich mal

hagbart
PostRank 1
PostRank 1
Beiträge: 26
Registriert: 23.10.2004, 11:50
Wohnort: Köln

Beitrag von hagbart » 23.10.2004, 12:30

von raw logs hab ich nix gefunden, im Ordner logs. Bin bei 1und1. Neben vielen htm Seiten, gibts da noch ne etwas größere Datei Namens accesslog

bull
PostRank 9
PostRank 9
Beiträge: 2166
Registriert: 20.09.2003, 20:57
Wohnort: Vèneto

Beitrag von bull » 23.10.2004, 12:36

Richtig. Bereits die Billigtarife bei 1 und 1 haben erfreulicherweise Echtzeit-Logs.
Es muß dort auch eine Datei namens access.log.43.6 geben (Kalenderwoche 43 Wochentag 6, also heute. Dabei handelt es sich um eine reine Textdatei. Die Logs der Vorwochen sind bei 1und1 gezippt und heißen access.log.42.gz usw, genauso die der Vortage. Die Logs hier sind im "Combined Log Format" gehalten, dessen Doku man hier findet https://httpsd.apache.org/docs/logs.html#combined (auch weiter oben auf der Seite lesen!) und deren Lektüre zum Verständnis erforderlich ist.
Zuletzt geändert von bull am 23.10.2004, 12:37, insgesamt 1-mal geändert.

hagbart
PostRank 1
PostRank 1
Beiträge: 26
Registriert: 23.10.2004, 11:50
Wohnort: Köln

Beitrag von hagbart » 23.10.2004, 12:36

OK scheint diese Datei zu sein, hab dort alle Einträge gefunden. Alle wgets kamen von der selben Ip: 217.93.30.149. Was ich nun mit diesem Wissen mache ist mir allerdings schleierhaft. :cry: Oder kann man rausbekommen wer hinter dieser IP steckt

bull
PostRank 9
PostRank 9
Beiträge: 2166
Registriert: 20.09.2003, 20:57
Wohnort: Vèneto

Beitrag von bull » 23.10.2004, 12:41

Hilfe ich bin gespidert worden! Was nun?

Nichts. Das Kind ist bereits in den Brunnen gefallen, und der Benutzer des Spiders hat jetzt eine lokale Kopie. Was er damit anstellt kann man nicht voraussagen.

samspade.org hat diverse Werkzeuge, darunter auch "IP Whois". In dieses Feld gebe man die verursachende IP ein. Bei der von Dir genannten handelt es sich um einen T-Online-Benutzer. Jetzt deswegen T-Online zu sperren ist allerdings wenig zweckmäßig. Bei Colocation- oder Nur-Hosting-Anbietern ist dies bereits sinnvoller, da mit menschlichen Benutzern dort nicht gerechnet zu werden braucht.
Man kann allenfalls Vorbeugemaßnahmen (siehe Sperrlisten hier im Forum, zu deren Verständnis die Lektüre von https://httpsd.apache.org/docs/mod/mod_rewrite.html notwendig ist) treffen.

Dieser Faden entwickelt sich bereits zum Tutorial.

hagbart
PostRank 1
PostRank 1
Beiträge: 26
Registriert: 23.10.2004, 11:50
Wohnort: Köln

Beitrag von hagbart » 23.10.2004, 12:50

Vielen Dank für die Infos :P

hagbart
PostRank 1
PostRank 1
Beiträge: 26
Registriert: 23.10.2004, 11:50
Wohnort: Köln

Beitrag von hagbart » 23.10.2004, 21:13

Nur noch mal zur Ergänzung. Heute Nachmittag hat ich bereits über 40.000 Zugriffe von Wget, inzwischen stürzt mein Statistik tool beim auswerten ab ;-) Langsam wirds mir unheimlich :o

fool
PostRank 5
PostRank 5
Beiträge: 200
Registriert: 28.03.2004, 12:12

Beitrag von fool » 24.10.2004, 16:04

Hallo hagbart,
dann wundert es mich aber, warum du noch immer nicht wget per htaccess geblockt hast. Schließlich ist das ja einfach möglich. Dann ist Schluß damit (...) oder der andere weiß, dass er den UserAgent in wget auch ändern kann.
Gruß
fool

hagbart
PostRank 1
PostRank 1
Beiträge: 26
Registriert: 23.10.2004, 11:50
Wohnort: Köln

Beitrag von hagbart » 24.10.2004, 18:50

Naja ich denk mal jetzt is es eh schon zu spät. Außerdem muss ich mich erstmal einlesen wie mit der htaccess umgegangen wird.

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag