wir haben neulich unser Forumsarchiv www.steuernetz-forum.de als statisches HTML online gestellt. Diverse Spider waren schon da - u.a. auch google. Kurioserweise liest google die Links von unseren Index-Dateien auf die HTML Dateien nicht korrekt. Beispiel:
Fragt man jetzt die gespiderten Seiten von steuernetz-forum.de bei google ab, erscheinen in der Google Trefferliste alle Index-Dateien sowie bereits etliche indizierte HTML-Dateien; allerdings setzt google für das letzte Slash folgenden frei Zeichen
Das %5C ist der hexadezimale Codewert für den \ im ASCII Zeichensatz. Deine Site nutzt den Latin-1 Zeichensatz (iso-8859-1), welcher wiederum den ASCII Zeichensatz umfasst.
Tipp: Wenn Du schon ein Archiv nutzt, dann sperre unbedingt das eigentliche Forum für Spider (duplicate content) und ersetze die Underscores durch Bindestriche. Deutlich besser wäre es natürlich, überhaupt kein Archiv zu nutzen, sondern die Site zu optimieren.
Gruß,
Manuel
Zuletzt geändert von manuelfu am 14.05.2005, 20:45, insgesamt 1-mal geändert.
@manuelfu
Das Forum-Archiv wird in unregelmässigen Abständen upgedatet (komplett Update, kein inkrementelles) - insofern läuft auch kein mod_rewrite im Hintergrund. In letzter Zeit wurden offline allerdings diverse Änderungen an Design und Metags durchgeführt - und anschließend das ganze Forumsarchiv wieder online gestellt.
Fakt ist aber doch: der Link ist korrekt - und zwar auch im Google Cache!!!!
Ein Link darf kein \ enthalten, da eure Links diese ständig enthalten, maskiert google diese völlig korrekt. Daß Browser so fehlertolerant sind, ist kein Argument.