Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

%20 Falsche URLs im Index

Hier können Sie Ihre Fragen zum Thema Suchmaschinenoptimierung (SEO) / Positionierung stellen
Gachet01
PostRank 4
PostRank 4
Beiträge: 137
Registriert: 01.02.2006, 14:41

Beitrag von Gachet01 » 25.09.2006, 12:08

Hallo,

habe ein großes Problem und zwar hab ich festgestellt, dass ich im index ca. 10000 Seiten habe die mit https://%20www.tld.de beginnen.

%20 steht ja bekanntermassen für eine Space. Zuerst hab ich vermutet, dass ich evtl. in meinem script irgendwo bei der URL Generation einen Space habe, dann stellte ich fest, das hier alles ok ist und das eine Webseite von ausserhalb auf mich mit http:// www.tld.de linkt.
Also ein Space nach //

Ich habe mit meinem Host gesprochen und diesem mitgeteilt, dass solch ein URL aufruf eigentlich einen 404 geben müsste. Dieser teilte mir mit, dass die DNS settings mit *. wildcards gesetzt wurden und das 99.9 % der Hosts so machen.

Das bedeutet ja jetzt, jeder könnte meine seiten schädigen, in dem er Backlinks mit Space zu mir setzt. Was kann ich tun?

Natürlich weiss ich das ich mit der httaccess einiges abfangen kann aber das ist doch eindeutig ein hostproblem. in meiner httaccess hab ich im moment folgendes:

RewriteBase /
RewriteCond %{HTTP_HOST} !^www\.test\.de$ [NC]
RewriteRule ^(.*)$ https://www.test.de/$1 [R=301,L]

So wird die domein ohne www zu www umgeleitet..gibts auch was, das alles was vor dem punkt kommt auf die hauptdomain umleitet?
Bitte um Hilfe.

Frage:

hat meiner Provider recht?
kann ich das prob per httacces lösen?

das z.b. https://test.de auf https://www.test.de geht und alles andere gibt einen 404? denn wenn ich keinen 404 bekomme, bleiben die seiten ja im index :(

probiert es mal selbst aus, eure domain mit %20www.tld.de aufzurufen..es ist erschreckend!

Anzeige von ABAKUS

von Anzeige von ABAKUS »


Hochwertiger Linkaufbau bei ABAKUS:
  • Google-konformer Linkaufbau
  • nachhaltiges Ranking
  • Linkbuilding Angebote zu fairen Preisen
  • internationale Backlinks
Wir bieten Beratung und Umsetzung.
Jetzt anfragen: 0511 / 300325-0

haha
PostRank 9
PostRank 9
Beiträge: 1065
Registriert: 03.04.2006, 18:08
Wohnort: Bi Hamborg

Beitrag von haha » 25.09.2006, 14:21

Gachet01 hat geschrieben:eine Webseite von ausserhalb auf mich mit http:// www.tld.de linkt.
Also ein Space nach //

Ich habe mit meinem Host gesprochen und diesem mitgeteilt, dass solch ein URL aufruf eigentlich einen 404 geben müsste. Dieser teilte mir mit, dass die DNS settings mit *. wildcards gesetzt wurden und das 99.9 % der Hosts so machen.
* Erstens sind da zwei Parteien im Spiel, einmal der DNS-Server, zusätzlich der Webserver. Zuerst muss der DNS-Server eine IP-Adresse für die Domain liefern, dann muss der Webserver unter dieser IP auch noch Anfragen an die Domain beantworten. Ersteres ist leicht umzusetzen, aber für Letzteres muss man sich je nach Betriebsart des Webservers schon etwas Mühe geben, damit so ein Bockmist dabei rauskommt. Dass es mit dem Leerzeichen so einfach funktioniert, könnte allerdings auf eine Besonderheit des HTTP-Protokolls zurückzuführen sein. Funktioniert denn auch blafasel.example.com?
* Zweitens halte ich die Aussage, um nicht zu sagen Ausrede, 99,9% aller Hosts machen es so, für reichlich gewagt.
* Drittens hat diese Einstellung keinerlei Vorteile, wenn man mal davon absieht, dass sie eventuell für faule und/oder inkompetente Hoster einen Tick bequemer ist.
* Viertens, aber das nur am Rande, kann bei einer nicht existenten Domain kein 404 kommen, sondern nur ein Verbindungsfehler. Der 404 gehört zum HTTP-Protokoll, das wiederum setzt voraus, dass eine Verbindung zustande kommt, was ohne Domain aber schlichtweg nicht möglich ist.
Was kann ich tun?
[…]
aber das ist doch eindeutig ein hostproblem.
Richtig, die Ursache liegt außerhalb Deines Einflussbereiches. Wechsle den Hoster, wenn er Dir einen so simplen Wunsch nicht erfüllen möchte. Der Markt ist breit genug, als dass Du Dich mit so einem Hallodri abgeben müsstest.
RewriteBase /
RewriteCond %{HTTP_HOST} !^www\.test\.de$ [NC]
RewriteRule ^(.*)$ https://www.test.de/$1 [R=301,L]

So wird die domein ohne www zu www umgeleitet..gibts auch was, das alles was vor dem punkt kommt auf die hauptdomain umleitet?
Die beiden Zeilen sind nach dem Prinzip "Ist es nicht A, leite nach A weiter" aufgebaut, greifen also bei allem, was nicht der gewünschten Domain entspricht.

Falls es bei Dir nicht funktioniert, liegt es daran, dass da die Zeile "RewriteEngine on" fehlt. Alternativ kann es auch sein, dass das Leerzeichen irgendwo untergeht. In Domains sind Leerzeichen nicht erlaubt, darüber hinaus dient das Leerzeichen als Feldtrenner im HTTP-Protokoll.

So oder so halte ich das für die falsche Vorgehensweise, weil Du damit nur die Symptome auszumerzen versuchst, aber nicht die Ursache beseitigst.

Gachet01
PostRank 4
PostRank 4
Beiträge: 137
Registriert: 01.02.2006, 14:41

Beitrag von Gachet01 » 25.09.2006, 15:16

Hallo,

vielen dank für die kompetente Antwort. Also blafasel.example.com führt zu confixx. Alles ohne leerzeichen für zu confixx. mmhhh :x

Für die Zeit, in der ich mir den neuen Hoster suche...ist dann der 3te in diesem Jahr, hätte ich gerne eine Weiterleitung bzw. 404. Wenn ich jetzt sofort wechsle, verliere ich ja die Domaingebühr welche jährlich entrichtet wird. Deswegen hab ich mal folgendes probiert, was auch funktioniert. Denn irgendwie muss ich ja jetzt erstmal per 404 oder wie du sagtest per Verbindungsfehler die falschen URLs rausbekommen.

Im Grunde will ich, dass eine die Domain test.de auf www.test.de umgeleitet wird. dies geht hiermit:

RewriteBase /
RewriteCond %{HTTP_HOST} ^test\.de$ [NC]
RewriteRule ^(.*)$ https://www.test.de/$1 [R=301,L]

Nun möchte ich noch, dass alles was nicht aussieht wie www.test.de einen Error bekommt, bzw. einen Verbindungsfehler, damit google diese falschen URLs auch wieder rauswirft. Ist ein Verbindungsfehler für google das gleiche wie ein 404, um die Seiten aus dem Index zu bekommen? Ich habe dies somit gelöst. Ist dies aber richtig? Es funktioniert zwar, d.h. im Firefox, IE zeigt die falschen URLs weiterhin an.

RewriteCond %{HTTP_HOST} !^www\.test\.de$ [NC]
RewriteRule ^(.*)$ - [F]

Vielen Dank!