Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Java-Spider???

Alles zum Thema: Robots, Spider, Logfile-Auswertung und Reports
Neues Thema Antworten
fool
PostRank 5
PostRank 5
Beiträge: 200
Registriert: 28.03.2004, 12:12

Beitrag von fool » 16.07.2004, 12:38

Hallo,

hat einer eine Ahnung, wer oder was das wahr?

69.118.3.227 - - [15/Jul/2004:08:43:49 +0200] "GET / HTTP/1.1" 200 10196 "-" "Java/1.4.2_04"
69.118.3.227 - - [15/Jul/2004:08:43:50 +0200] "GET /links.html HTTP/1.1" 404 1981 "-" "Java/1.4.2_04"
69.118.3.227 - - [15/Jul/2004:08:43:50 +0200] "GET /kontakt.html HTTP/1.1" 404 1981 "-" "Java/1.4.2_04"

und dann auch noch erst eine 200-Meldung dann aber die 404

Gruß
fool

Anzeige von ABAKUS

von Anzeige von ABAKUS »


Hochwertiger Linkaufbau bei ABAKUS:
  • Google-konformer Linkaufbau
  • nachhaltiges Ranking
  • Linkbuilding Angebote zu fairen Preisen
  • internationale Backlinks
Wir bieten Beratung und Umsetzung.
Jetzt anfragen: 0511 / 300325-0

slinky
PostRank 5
PostRank 5
Beiträge: 299
Registriert: 28.01.2004, 14:27
Wohnort: Kempen

Beitrag von slinky » 16.07.2004, 12:57

Hi fool,

IPv4-adress: 69.118.3.227
addr-out: ool-457603e3.dyn.optonline.net
*edit

Wer das genau ist, kann ich Dir aber leider nicht sagen.
Kenn ich auch nicht.

gruß

slinky

UweT
PostRank 10
PostRank 10
Beiträge: 5601
Registriert: 03.01.2003, 00:07

Beitrag von UweT » 16.07.2004, 16:23

SLINKY hat geschrieben:Wer das genau ist, kann ich Dir aber leider nicht sagen.
Kenn ich auch nicht.
Wenn man nun 1 und 1 zusammen zählt, kommt der normal denkende Mensch darauf, dass es sich hier um eine dynamische IP des Kabel-ISPs OptimumOnline handelt und man es hier mit einem gefakten Spider eines Privatanwenders zu tun hat. Da die meisten Kunden dieses ISPs aus New York/USA kommen, kann man schwer davon ausgehen, dass der Verursacher auch daher kommt, es sei denn er setzt Proxy Server ein.

gruß
tbone.

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


slinky
PostRank 5
PostRank 5
Beiträge: 299
Registriert: 28.01.2004, 14:27
Wohnort: Kempen

Beitrag von slinky » 16.07.2004, 16:41

Hi tbone,

es ist Freitag abend, kurz vor dem Wochenende.
Meinst Du, da bin ich noch in der Lage normal zu denken? :Fade-color

Aber eine interessante Schlussfolgerung!!!

Schönes Wochenende

slinky

Noki
PostRank 7
PostRank 7
Beiträge: 639
Registriert: 16.05.2003, 22:27
Wohnort: Gernsbach

Beitrag von Noki » 16.07.2004, 17:28

Der einzige Spider den ich kenne der auf Java basiert kommt von Nutch.org - https://www.nutch.org/docs/de/ - der Useragent sollte dort aber Nurch sein - Habe mir das aber nie genauer angeschaut...

dirk
PostRank 8
PostRank 8
Beiträge: 712
Registriert: 24.11.2003, 18:30
Wohnort: TmV1c3M=

Beitrag von dirk » 16.07.2004, 17:35

Ich denke mal, wenn da einer mit java programmiert und ein simples GET macht, wird das als useragent gesetzt.

fool
PostRank 5
PostRank 5
Beiträge: 200
Registriert: 28.03.2004, 12:12

Beitrag von fool » 16.07.2004, 20:01

Dank euch schon mal für die vielen Beträge.
Hat jetzt auch noch jemand eine Erklärung dafür, warum meine Seiten dann alle eine 404-Fehlermeldung ausgelöst haben. Die Seiten gibt es.

@noki
nutch.org kommt bei mir auch vorbei. Und die haben wirklich immer ihre kennung.


schönes wochenende
fool

Michael
PostRank 8
PostRank 8
Beiträge: 808
Registriert: 04.01.2004, 20:23
Wohnort: Herne

Beitrag von Michael » 16.07.2004, 21:04

Klare Sache.
1. Ein einfaches Java Programm mit dem default user_agent
2. Die Seiten konnten nicht gelesen werden. (404 = Not Found)
3. 1 hat mit 2 nichts zu tun.

Es kann passieren, dass z.B. der Host: im HTTP1.1 nicht richtig gesetzt war, dann ist der Webserver meist etwas zickig.

Gruß
Michael

Noki
PostRank 7
PostRank 7
Beiträge: 639
Registriert: 16.05.2003, 22:27
Wohnort: Gernsbach

Beitrag von Noki » 17.07.2004, 00:59

@fool

ja, aber das ding ist ja opensource - ich hab keine ahnung was das ding als kennung liefert wenn ich den crawler nun für ne eigene suma nutze...

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag