Seite 1 von 1

merkwürdige indexierung - mit und ohne .htm!

Verfasst: 04.03.2007, 18:54
von alph
Hallo!

ich hab folgendes Problem: mir ist aufgefallen, dass seit einpaar Tagen bei einer meiner Domains einige Unterseiten mit und ohne .html im Google-Index vorhanden sind.

z.B.:
www.domain.de/unterseite.htm
und
www.domain.de/unterseite

obwohl zu der letzten Version nirgendwo ein Link vorhanden ist. Was mir noch aufgefallen ist, dass man meine Unterseiten mit und ohne .htm im Browser aufrufen kann - das ist aber nur bei den beiden 1&1 Domains der Fall. Bei anderen Providern wird "Die Seite wurde nicht gefunden" angezeigt, wenn ich irgeneine Unterseite ohne .htm aufrufen will.

Was kann man da machen, um doppelten Content zu vermeiden? hat jemand von euch schon mal dieselbe Erfahrung machen müssen?

Wäre für jeden Tipp dankbar!

gruß
alph

Verfasst:
von

Verfasst: 04.03.2007, 20:07
von Mamboo
leite mir .httacess die variante, die du im index nicht haben willst auf die andere Seite um und damit hat sich die sache.

Ausserdem kannst du im meta bereich den robots die folgende werte übergeben: "noindex, nofollow"

Mehr über htaccess: htaccess leitfaden

Viel Erfolg

Verfasst: 04.03.2007, 20:30
von Ice Man
da hat wohl einer den gleichen Fehler wie ich gemacht, du hast in der .htaccess warscheinlich ein "*" verwendet.

Dadurch würde es auch so gehen

www.domain.de/unterseite.gay :D

Verfasst:
von

Verfasst: 04.03.2007, 21:23
von alph
Hallo!

danke für eure antworten!
leite mir .httacess die variante, die du im index nicht haben willst auf die andere Seite um und damit hat sich die sache.

kannst du bitte posten, wie ich es genau machen kann. Auf der Seite "Mehr über htaccess: htaccess leitfaden" blicke ich leider nicht durch :(
Ausserdem kannst du im meta bereich den robots die folgende werte übergeben: "noindex, nofollow"

also da hast du, glaube ich, was falsch verstanden. Wenn ich der Seite www.domain.de/unterseite.htm "noindex, nofollow" verpasse, dann wird sie auch nicht indexiert, nicht nur die Seite www.domain.de/unterseite - die gibt es ja in Wirklichkeit garnicht :wink: . Deswegen verstehe ich auch nicht, wie Google überhaupt darauf kommt sie zu indexieren :o
da hat wohl einer den gleichen Fehler wie ich gemacht, du hast in der .htaccess warscheinlich ein "*" verwendet.

Dadurch würde es auch so gehen

www.domain.de/unterseite.gay


ohne "*" funzt bei mir die Umleitung garnicht :wink: Außerdem haben bei mir alle Domains die gleiche .htaccess, Aber nur bei den 1&1 Domains ist es möglich die Seiten ohne .html aufzurufen, bei den anderen (z.B. bei netclusive) nicht!
Und was noch ganz wichtig ist: die zweite Version (ohne .html) gibt es erst seit zwei-drei Tagen im Google-index und die .htaccesss war bei mir immer die gleiche (mit "*"). ich hätte da eine Vermutung, dass 1&1 evtl. irgendwelche Umstellungen vorgenommen hat.

Hier als Beweis:

1.
https://www.webkatalog-top-eintrag.de (Server bei netclusive) - hier kannst du die Unterseiten nicht ohne .html aufrufen!

2.
https://www.alphamultimedia.de (Webhosting-Paket bei 1&1 seit 1,5 Jahren) - hier kannst jede Unterseite mit und ohne .htm aufrufen. Und wie gesagt erst seit 2-3 Tagen werden beide Versionen (bis jetzt nur bei einpaar Unterseiten) im Google-Index angezeigt.

Vielleich hättet ihr noch eine Idee, wie es dazu kommen konnte?

PS: die .htaccess sieht bei allen meinen Domains folgendermaßen aus:
RewriteEngine on

RewriteCond %{HTTP_HOST} !^www\.domain\.de$
RewriteRule ^(.*)$ https://www.domain.de/$1 [L,R=301]

order allow,deny
allow from all
Deny from 202.212.112.0/24
Deny from 217.68.165.0/24
Deny from 66.228.121.0/24
Deny from 217.20.117.0/24
Deny from 89.149.194.0/24
Deny from 208.101.13.0/24
Deny from 208.101.5.0/24
Deny from 75.126.94.0/24
Deny from 75.126.95.0/24
Deny from 218.1.138.0/24
Deny from 209.240.253.0/24
Deny from 38.119.107.0/24

################################################
################################################

#6-gizliweb#
#7-gizliweb#
#8-gizliweb#
#9-gizliweb#
#10-fjt.cnitn.cn#
#11-gritechnologies.com#
#12-securebar.secure-tunnel.com#

################################################
################################################
gruß
alph[/quote]

Verfasst: 04.03.2007, 21:52
von oldInternetUser
Das scheint ein allgemeines Problem bei 1&1 zu sein.

Ich kann das auf einer Domain reproduzieren, auf der keinerlei mod_rewrite, PHP oder ähnliches läuft.

Es ist also auch htaccess - unabhängig.

Verfasst: 04.03.2007, 22:22
von Ice Man
habs gerade bei mir probiert, bei all-inkl funktioniert das auch

Also ich kann jede seite ohne Endung aufrufen.
Hab mal irgendwo gelesen, das das normal ist.

Wenn du so eine Seite im Index hast, dann wird wohl irgendwo ein Link falsch sein.

Verfasst: 04.03.2007, 22:58
von Andreas I.
Es gibt da so eine Einstellung im Apachen, die korrigiert automatisch Tippfehler. Felher.hml wird korrigiert zu Fehler.html (Soweit vorhanden) Vielleicht hat diese Einstellung einfach das fehlende .html hinzukorrigiert...
Da ich mich nicht jeden Tag mit Apache-Einstellungen beschäftige, weiß ich nur, dass es sowas gibt, aber nicht genau, wie die heisst!

Wahrscheinlich ist diese Fehlerkorrektur bei einem Provider aktiv, beim anderen nicht...?

Verfasst: 04.03.2007, 23:01
von chris21
Versuch mal

Code: Alles auswählen

Options -Multiviews
oben in Deine .htaccess einzufügen, dann sollte das Problem Vergangenheit sein.

Verfasst: 05.03.2007, 10:16
von Kristian
Hallo

Es handelt sich wohl um mod_speling
In die .htaccess will man "CheckSpelling Off" schreiben.

Gruss Kristian

Verfasst: 05.03.2007, 22:58
von alph
chris21 hat geschrieben:Versuch mal

Code: Alles auswählen

Options -Multiviews
oben in Deine .htaccess einzufügen, dann sollte das Problem Vergangenheit sein.


hey chris21!

vielen Dank für deinen Tipp!! Funzt einwandfrei :D ! *auf-den-boden-schmeiß-und-füße-küß* :wink:

jetzt wird folgendes angezeigt, wenn man die Seite ohne Endung eintippt:
Multiple Choices
The document name you requested (/gemaelde) could not be found on this server. However, we found documents with names similar to the one you requested.
Available documents:

/gemaelde.htm (common basename)

auch vielen Dank an alle anderen für eure Beiträge!

gruß
alph