Seite 1 von 3
404 -> 302 -> error.html
Verfasst: 16.12.2004, 15:14
von chio
Hallo!
Ich bin ja ein Server-Trottel, sorry für die laienhafte Frage:
Bei den meisten meiner Sites wird ein 404er auf zb "error.html" weitergeleitet. Mittels 302.
In meinen Statistiken muss ich feststellen, dass eben diese "error.html" eine sehr häufige Entry- oder Exit Page ist. Sagt sowohl Webalizer als auch AWStats. Ein Counter hingegen zählt nichts.
Mein Provider meint, das sind Hacker-Versuche, die einfach willkürliche URLs abchecken, ob sie was erwischen.
Kann das sein? Könnte es auch sein, dass das Bot-Aktivitäten sind? Also dass zb der GoogleBot immer noch Seiten abgrast, die es schon lange nicht mehr gibt?
Sollte die Weiterleitung dann mit 301 gemacht sein? Oder geht das gar nicht?
jou
chio
Verfasst: 16.12.2004, 17:40
von manute
das kann hacking sein, aber es gibt auch diverse browser+addons, die irgendwelche urls aufrufen.
zb domain.tld/_vti_bin/owssvr.dll ist so ein ding, das - ich glaub es war der ie - regelmäßig aufrufen will aber die meisten nicht haben. kannst mal danach googlen, wenn du es genau wissen willst. gibt einiges von der sorte.
dass der googlebot alte seiten abgrast, kann vorkommen, wenn er dann nen 404 bekommt ists doch ok wenn die urls lange schon nicht mehr da sind.
Verfasst: 16.12.2004, 18:13
von chio
Hallo!
Der Bot bekommt ja keinen 404er, sondern 302 mit Angabe einer neuen URL (=error.html). Aber ich denke mal, dass das ein übliches Verfahren ist.
Bei einer meiner Seiten ist die error.html die am häufigsten aufgerufene Datei - noch VOR dem style.css - unmöglich, wenn das "gesehener" Traffic wäre, weil auch error.html das Style-Sheet verwendet.
Könnte das auch durch nicht mehr vorhandene Bilder entstehen?
*stirnrunzel*
Verfasst: 16.12.2004, 18:20
von manute
Könnte das auch durch nicht mehr vorhandene Bilder entstehen?
könnte. kommt auf deine programmierung an.
Der Bot bekommt ja keinen 404er, sondern 302 mit Angabe einer neuen URL (=error.html).
302 ist doch "temporarily moved" - dann ist es doch logisch, dass der bot auch in 100 jahren noch auf der alten url vorbeischaut. mach nen 301 draus.
Verfasst: 16.12.2004, 19:01
von JOO
Aber wenn man per .htaccess Fehlerseiten festlegt:
ErrorDocument 404 https://www.domain.de/404.html
dann wird doch automatisch ein 302 gesendet?!

Verfasst: 16.12.2004, 19:14
von schaulmeier
das hoffe ich nicht, ich hoffe da wird ein 404 gesendet
Verfasst: 16.12.2004, 19:21
von chio
Was kommt, kann man hier ansehen:
https://www.andyhoppe.com/software/http ... header.htm
Und dann frage ich mich auch, warum ein 301 gesendet werden soll. Ich habe ja nicht die fehlende Seite verschoben (zu error.html) sondern sie ist einfach weg: -> also 404 wäre richtig.
Verfasst: 16.12.2004, 19:30
von manute
jo, 404 wäre noch richtiger, 301 auch ok aber 302 ist kwark.
Verfasst: 16.12.2004, 19:38
von JOO
manute hat geschrieben:jo, 404 wäre noch richtiger, 301 auch ok aber 302 ist kwark.
Und wie bekomme ich das hin, wenn ich eine individuelle Error 404 Seite festlegen will?
lg
JOO
Verfasst: 16.12.2004, 19:43
von manute
Code: Alles auswählen
ErrorDocument 404 http://domain.de/deinedateifuer404.html
in die htaccess.
Verfasst: 16.12.2004, 19:44
von JOO
manute hat geschrieben:Code: Alles auswählen
ErrorDocument 404 http://domain.de/deinedateifuer404.html
in die htaccess.
Aber dann wird ja ein 302 gesendet, dass ist ja das Problem!
lg
JOO
Verfasst: 16.12.2004, 19:56
von manute
stimmt. war mir so nicht bewusst. bin ebenfalls ratlos, schließe mich den fragenden an und flehe um hilfe.

Verfasst: 16.12.2004, 20:00
von Jörg
Bei mir wird mit folgendem Eintrag in der .htaccess eine 404 gesendet:
Verfasst: 16.12.2004, 20:05
von chio
Hallo!
Ist 302 _wirklich_ kwark??
Das muss ein Bot doch merken, dass da immer die gleiche Seite kommt. Außerdem zeigen auf nicht mehr vorhandene Seite ja auch keine Links mehr. Warum sollte ein Bot da immer wieder nachsehen?
Verfasst: 16.12.2004, 20:11
von JOO
aha, die Lösung des Problems liegt also darin den lokalen Pfad anzugeben...
lg
JOO