Seite 1 von 1

test.htm/blah.htm htaccess-Duplicate-Content-Problem

Verfasst: 08.12.2007, 16:52
von Rem
Ich habe ein grosses Problem. Durch die Verwendung einer htaccess werden folgende Seiten nicht als 404 ausgegeben:
https://www.frontnews.de/wissenschaft/b ... p/test.htm
https://www.frontnews.de/wissenschaft/b ... /test2.htm
https://www.frontnews.de/wissenschaft/b ... 654654.htm

Im Prinzip wird "biologie.php" einfach einen Ordner tiefer gespiegelt.

Auf der oberen Domain ist die htaccess folgendermassen:

Code: Alles auswählen

RewriteEngine On
RewriteCond %{HTTP_HOST} ^frontnews\.de$ [NC]
RewriteRule ^(.*)$ http://www.frontnews.de/$1 [R=301,L]
Achtung. Das Problem tritt auf, sobald eine htaccess vorhanden ist. Das Problem ist also auch bei einer leeren htaccess vorhanden. Sobald die htaccess gelöscht wird, ist der 404 wieder vorhanden.

Das Problem tritt nur bei solchen URLs auf:
datei.htm/0934058345.htm oder
index.php/35345345.htm
Also typischerweise "konkrete Datei/irgendeinblödsinn"

Folgende zwei Sicherheitsrisiken habe ich ausgemacht:
a) Dublicate Content. Ideal für Black Hat SEO
b) Adressierungen in PHP-Programmen stimmen nicht, wenn "index.php" eine Ordner-Ebene tiefer ausgeführt wird.

Kann mir jemand bitte dabei helfen, dass wieder ein 404 ausgegeben wird?

Verfasst:
von

Verfasst: 08.12.2007, 18:52
von w3news
Also ich würde da auf die php.ini setzen oder eh nach Serverbetriebssystem direkt im Apache Modul, wahrscheinlich eher da.

Verfasst: 08.12.2007, 19:02
von Rem
Hallo!

Mir wäre schon ok, mittels 301 alle solchen Aufrufe umzuleiten:

test.htm/irgendwas.php -> test.htm
datei.shtm/irgendwasnders.htm -> datei.shtm

Wenn es dafür eine Rule gibt, dann wäre ich zu Dank verpflichtet.

Alles andere steht partiell ausserhalb meiner Kontrolle.

Edit: Ok die Lösung nach einigen Stunden und dank des Modrewrite.de-Forums rausbekommen
https://httpsd.apache.org/docs/2.0/de/m ... ptpathinfo

Diese Zeile in der htaccess ergänzt:
AcceptPathInfo Off