Seite 1 von 1

pdf-Downloads in den Logfiles erkennen

Verfasst: 06.07.2004, 19:50
von Treepwood
Hallo zusammen,

ich kann aus meinen logfiles (mittels Logfile Analyse Tool) erkennen, dass bestimmte PDF Files auf meiner Website sehr häufig abgerufen werden.

Ich wüsste nun gerne, wie die Leute zu diesem PDF gelangen, denn es kann nicht sein, dass sie sich durch die Seite klicken. Ich habe die Wermutung, dass irgendwer direkt zu meinen PDFs verlinkt. Kann man sowas erkennen oder spiegeln das die Logfiles nicht wider?

Ich glaube auch nicht, dass der Traffic durch Suchmaschinen entsteht, da ich keine entsprechenden Logs finden kann????

Habt ihr ne Erklärung? :-?

Verfasst:
von

Verfasst: 06.07.2004, 20:09
von Southmedia
Schau dir die Referer an die die Aufrufe auf die PDF-Dateien haben.

Verfasst: 06.07.2004, 20:17
von Treepwood
Da steht dann z.B. so etwas:

Code: Alles auswählen

62.245.247.210 - - [05/Jul/2004:10:31:48 +0200] "GET /reports/Marktanalyse_Der_Markt_fuer_Frischeprodukte_in_Convenience_Stores_in_Europa.pdf HTTP/1.0" 200 15557 "-" "Mozilla/8.1 (Cool-OS; 1024-bit)"
62.245.247.210 - - [05/Jul/2004:10:31:48 +0200] "GET /reports/Marktanalyse_Der_Markt_fuer_Frischeprodukte_in_Convenience_Stores_in_Europa.pdf HTTP/1.0" 200 15557 "-" "Mozilla/8.1 (Cool-OS; 1024-bit)"
62.245.247.210 - - [05/Jul/2004:10:31:49 +0200] "GET /reports/Marktanalyse_Der_Markt_fuer_Frischeprodukte_in_Convenience_Stores_in_Europa.pdf HTTP/1.0" 206 225434 "-" "Mozilla/8.1 (Cool-OS; 1024-bit)"
Sind das Suchbots?

Verfasst:
von
SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


Verfasst: 06.07.2004, 20:23
von Treepwood
Oder wie kommen soviele Zugriffe innerhalb so kurzer Zeit zustande?

Code: Alles auswählen

194.95.67.35 - - [05/Jul/2004:15:10:14 +0200] "GET /reports/Case_Study_3_Schlack_Partner_The_Greenery.pdf HTTP/1.1" 206 1024 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)"
194.95.67.35 - - [05/Jul/2004:15:10:14 +0200] "GET /reports/Case_Study_3_Schlack_Partner_The_Greenery.pdf HTTP/1.1" 206 1024 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)"
194.95.67.35 - - [05/Jul/2004:15:10:14 +0200] "GET /reports/Case_Study_3_Schlack_Partner_The_Greenery.pdf HTTP/1.1" 206 1024 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)"
194.95.67.35 - - [05/Jul/2004:15:10:14 +0200] "GET /reports/Case_Study_3_Schlack_Partner_The_Greenery.pdf HTTP/1.1" 206 4150 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)"
194.95.67.35 - - [05/Jul/2004:15:10:16 +0200] "GET /reports/Case_Study_3_Schlack_Partner_The_Greenery.pdf HTTP/1.1" 206 84242 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)"
194.95.67.35 - - [05/Jul/2004:15:10:17 +0200] "GET /reports/Case_Study_3_Schlack_Partner_The_Greenery.pdf HTTP/1.1" 206 12543 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)"
194.95.67.35 - - [05/Jul/2004:15:10:19 +0200] "GET /reports/Case_Study_3_Schlack_Partner_The_Greenery.pdf HTTP/1.1" 206 13924 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)"
194.95.67.35 - - [05/Jul/2004:15:10:21 +0200] "GET /reports/Case_Study_3_Schlack_Partner_The_Greenery.pdf HTTP/1.1" 206 20879 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)"
194.95.67.35 - - [05/Jul/2004:15:10:23 +0200] "GET /reports/Case_Study_3_Schlack_Partner_The_Greenery.pdf HTTP/1.1" 206 48978 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)"
194.95.67.35 - - [05/Jul/2004:15:10:25 +0200] "GET /reports/Case_Study_3_Schlack_Partner_The_Greenery.pdf HTTP/1.1" 206 41851 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)"
194.95.67.35 - - [05/Jul/2004:15:10:27 +0200] "GET /reports/Case_Study_3_Schlack_Partner_The_Greenery.pdf HTTP/1.1" 206 14737 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)"
194.95.67.35 - - [05/Jul/2004:15:10:30 +0200] "GET /reports/Case_Study_3_Schlack_Partner_The_Greenery.pdf HTTP/1.1" 206 12550 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)"
194.95.67.35 - - [05/Jul/2004:15:10:32 +0200] "GET /reports/Case_Study_3_Schlack_Partner_The_Greenery.pdf HTTP/1.1" 206 34777 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)"
194.95.67.35 - - [05/Jul/2004:15:10:34 +0200] "GET /reports/Case_Study_3_Schlack_Partner_The_Greenery.pdf HTTP/1.1" 206 34115 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)"
194.95.67.35 - - [05/Jul/2004:15:10:36 +0200] "GET /reports/Case_Study_3_Schlack_Partner_The_Greenery.pdf HTTP/1.1" 206 11855 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)"
Bin in Sachen Logfileanlayse leider ein totaler Rookie... habe keinen eigenen Server und kann somit kein eigenes Analysetool online stellen. Das von meinem Hoster (all-inkl) ist eher mager... nur die Top 10 Suchbegriffe etc...

Könnt ihr mir eine Software empfehlen, mit denen ich meine gedownloadeten Logfiles "offline" analysieren kann?

Verfasst: 06.07.2004, 20:41
von Southmedia
Man sieht dass es immer die selbe IP ist die da zugreift, Referer wird auch keiner übertragen:

194.95.67.35 - - [05/Jul/2004:15:10:32 +0200] "GET /reports/Case_Study_3_Schlack_Partner_The_Greenery.pdf HTTP/1.1" 206 34777 "-"[b/] "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)"

Die Logfiles von All-Inkl lassen sich klasse analysieren, das sind die Apache-Standard-Logs. Einfach runterladen aus dem Ordner "logs" und mit einem beliebigen Logfile-Analyseprogramm analysieren. Danach sollteste einfach mal in Google suchen.

Verfasst: 06.07.2004, 20:53
von Treepwood
Die Logfiles von All-Inkl lassen sich klasse analysieren, das sind die Apache-Standard-Logs. Einfach runterladen aus dem Ordner "logs" und mit einem beliebigen Logfile-Analyseprogramm analysieren. Danach sollteste einfach mal in Google suchen.
Kannst du mir da eine Empfehlung geben? Welche Software ist die "Beste"?
Man sieht dass es immer die selbe IP ist die da zugreift, Referer wird auch keiner übertragen:

194.95.67.35 - - [05/Jul/2004:15:10:32 +0200] "GET /reports/Case_Study_3_Schlack_Partner_The_Greenery.pdf HTTP/1.1" 206 34777 "-"[b/] "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)"


Aber warum wird so oft in so kurzer Zeit auf ein und dieselbe Datei zugegriffen?

Schon einmal vielen Dank für deine Hilfe :)

Verfasst: 06.07.2004, 21:06
von impi
Treepwood hat geschrieben:
Kannst du mir da eine Empfehlung geben? Welche Software ist die "Beste"?
Hallo, versuchs mal mit Mescalero, Trial-Version auf https://www.rendle.de/.
Es gibt sicher noch mächtigere, aber bei dieser ist m.E. das Preis/Leistungsverhältnis sehr gut.

Falls Du die testest: Dieses Programm hat eine bots.dat, die (den entsprechenden Haken gesetzt) robots-zugriffe ausfiltert. Falls Du eine halbwegs gepflegte robots.dat haben möchtest ==> pm

impi

Verfasst: 07.07.2004, 10:08
von SISTRIX
194.95.67.35 - - [05/Jul/2004:15:10:14 +0200] "GET /reports/Case_Study_3_Schlack_Partner_The_Greenery.pdf HTTP/1.1" 206 4150 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)"
Die 4150 ist die Bytezahl, bei der der Webserver anfängt die Datei auszuliefern. Es sieht für mich also so aus, als ob ein Downloadmanager mit vielen parallelen Zugriffen die Datei geladen hat.

Gruss Johannes

Verfasst: 07.07.2004, 13:54
von Taurus
@Treepwood

ich habe das gleiche Phänomen in meinen Logfiles und vermute, daß es an der Optimierung der PDFs fürs Web liegt. Durch das Feature "page-at-a-time downloading " werden die PDFs seitenweise geladen.
Deshalb wird als Error-Code auch 206 "Partial Content" zurückgegeben.
Leider zählt das Logfile-Analyse Tool jede Seite als einen Download.
Infos zu dem Feature von PDF findest Du unter: https://www.adobe.com/support/techdocs/29772.htm

Gruß Christian