Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Seltsame Pfade

Ajax, Hijax, Microformats, RDF, Markup, HTML, PHP, CSS, MySQL, htaccess, robots.txt, CGI, Java, Javascript usw.
Neues Thema Antworten
unknownsoul
PostRank 9
PostRank 9
Beiträge: 1604
Registriert: 08.02.2006, 08:28

Beitrag von unknownsoul » 31.01.2008, 12:34

Hallo zusammen,

ich habe derzeit folgendes Problem. Irgendjemand hat mich auf diese Art verlinkt: www.domain.de/seite.php/seite.php

Das Problem ist, dass Google diese Seite natürlich auch crawlt und die Unterseite "seite.php/seite.php" auch im Browser angezeigt wird. Allerdings ohne stylesheet etc. Aber der Content selbst erscheint. Nun schnappt sich Google diese Seite als Basis und crawlt das gesamte Projekte nach diesem Schema. Grundlage ist immer diese "seite.php". Er hängt nach dem "/" immer eine andere existente Seite dran.

Kann man das Ganze irgendwie per .htaccess unterbinden?

Anzeige von ABAKUS

von Anzeige von ABAKUS »

Content Erstellung von ABAKUS Internet Marketing
Ihre Vorteile:
  • einzigartige Texte
  • suchmaschinenoptimierte Inhalte
  • eine sinnvolle Content-Strategie
  • Beratung und Umsetzung
Jetzt anfragen: 0511 / 300325-0

To-Bi-As
PostRank 6
PostRank 6
Beiträge: 443
Registriert: 08.10.2006, 02:20

Beitrag von To-Bi-As » 01.02.2008, 03:48

@unknownsoul
ja, kann man verhindern, aber in dem Fall würde ich da nix verhindern wollen sondern lieber den Fehler suchen.

www.domain.de/seite.php selber steht ja wohl nicht in der .htaccess, also wird die Datei direkt aufgerufen und zwar im Verzeichnis "seite.php". Dieses wird es ja wohl nicht geben, also sollte da Dein vorhandenes System einen Fehler liefern.

Im Nachhinein nochmal prüfen und verbieten geht, ist aber ungeschickt.

Entweder sind da die vorhandenen Rules fehlerhaft, so dass die Mist durchlassen, oder das Script selber. Also genauere Infos mit echten Beispielen wären schon besser um was zu sagen.

Gruß, Ingo

unknownsoul
PostRank 9
PostRank 9
Beiträge: 1604
Registriert: 08.02.2006, 08:28

Beitrag von unknownsoul » 01.02.2008, 09:49

Das betrifft wohl etliche Seiten (Beispiel): https://www.abakus-internet-marketing.d ... 52331.html

Ich hab dazu mal mehrere, z.T. auch sehr bekannte Seiten getestet. Bisher hats überall geklappt, wenn ich den Dateiname nochmal mit "/dateiname.Endung" ranhänge. Muss auch nicht unbedingt der Dateiname sein. Irgendein Anhängsel reicht.

Das liegt meines Wissens dann nicht am Script oder einer fehlerhaften .htaccess.

Ich frage jetzt per PHP auf der betreffenden "seite.php" ab, ob $_SERVER['PHP_SELF'] noch etwas anderes enthält, als es enthalten darf. Wenn ja, bekommt Google nun einen 404. Aber eine echte Lösung, für allem für das gesamte Projekt, scheint das nicht zu sein.

Der Fehler selbst entstand, weil ich so fehlerhaft verlinkt wurde. Der Link wurde zwar geändert, aber Google kennt nun diese "neue" Seite und crawlt.