Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Wie verhindere ich das ein Spider https:// nicht spidert?

Alles zum Thema: Robots, Spider, Logfile-Auswertung und Reports
Neues Thema Antworten
marky
PostRank 3
PostRank 3
Beiträge: 88
Registriert: 24.07.2005, 09:12

Beitrag von marky » 24.02.2006, 12:53

Hallo,

mir ist aufgefallen, dass Google bei einem Projekt die Domin über https gespidert hat und nur wenig über http - die SSL_Domain muss aber im gleichen Root, wie die "normale" Domain bleiben.

Wie kann ich es jetzt verhindert, dass die Robots nicht die https, sondern ausschliesslich die http domain spidern.

Und wie bekomme in die Seiten korrekt in den Index?

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


thetrasher
PostRank 5
PostRank 5
Beiträge: 238
Registriert: 31.12.2005, 10:50
Wohnort: Bad Tölz

Beitrag von thetrasher » 24.02.2006, 14:12

Google fordert getrennte robots.txt-Dateien: https://www.google.de/webmasters/remove.html

"https://IhrServer.de/robots.txt" und "https://IhrServer.de/robots.txt" müssen sich unterscheiden.

In Deinem Spezialfall muss mod_rewrite eingesetzt werden (Umleitung auf von robots.txt auf robots-https.txt anhand von SERVER_PORT).

marky
PostRank 3
PostRank 3
Beiträge: 88
Registriert: 24.07.2005, 09:12

Beitrag von marky » 24.02.2006, 14:43

Hallo,

super danke genau das habe ich gesucht, hat da jemand zufällig eine rewritezeile für mich, danke und helau :-)

marky
PostRank 3
PostRank 3
Beiträge: 88
Registriert: 24.07.2005, 09:12

Beitrag von marky » 24.02.2006, 14:57

Habs selber gefunden, es gibt die Variable HTTPS und damit es dann so

RewriteCond %{HTTPS} on
RewriteRule ^robots.txt$ robotsll.txt

Danke nochmal und ein schönes Wochenende ...

Christophe
PostRank 5
PostRank 5
Beiträge: 246
Registriert: 13.12.2004, 13:07

Beitrag von Christophe » 13.03.2006, 20:36

Danke, das sieht doch nach einer eleganten Lösung aus. Sowas habe ich neulich gesucht. Eine Winzigkeit würde ich noch ergänzen:

Code: Alles auswählen

RewriteCond %{HTTPS} on
RewriteRule ^robots\.txt$ robots-https.txt
Man beachte den Backslash. :)

Gastro
PostRank 6
PostRank 6
Beiträge: 400
Registriert: 25.05.2005, 12:26

Beitrag von Gastro » 29.03.2006, 17:00

Gibt es sonst einen DC Problem wenn die alle http und gleichen aber https Dateien drin (google index) sind??

und was schreibt man in der robots-https.txt rein?
etwa das hier:

User-agent: *
Disallow: /

Gruß
Gastro

marky
PostRank 3
PostRank 3
Beiträge: 88
Registriert: 24.07.2005, 09:12

Beitrag von marky » 01.04.2006, 21:24

Hallo,

oben ist ein Link zu Google, dort steht genau drin, was man machen muss und die Lösung für mod_write für die robots.txt hast Du ja oben.

Hat bei mir übrigens innerhalb eines Tages funktioniert.

martin10969
PostRank 1
PostRank 1
Beiträge: 3
Registriert: 10.05.2006, 15:02

Beitrag von martin10969 » 10.05.2006, 15:11

@marky

hast Du das backslash verwendet, wie von Christophe hier beschrieben oder den Code original wie in Deinem Beitrag? Bin gerade schwer am testen und mit Backslash hatte es bisher nicht richtig funktioniert. Jetzt versuche ich es mal ohne:

RewriteCond %{HTTPS} on
RewriteRule ^robots.txt$ robots-https.txt

gruß
martin

redcan
PostRank 4
PostRank 4
Beiträge: 159
Registriert: 25.04.2005, 13:25

Beitrag von redcan » 22.06.2006, 10:56

bei mir gehts so, aber vorsicht beim testen, erst mal mit test.txt statt der robots.txt!

Code: Alles auswählen

RewriteCond   %{SERVER_PORT}   ^443$ 
RewriteRule ^robots\.txt$ /robots-https.txt [L,NC]

GoSEO
PostRank 1
PostRank 1
Beiträge: 13
Registriert: 24.02.2006, 16:30

Beitrag von GoSEO » 15.02.2007, 09:24

Das gleiche Problem ist auf einen meiner Seiten aufgetreten. Dort werden https-Seiten bei G im Index angezeigt und eben nicht die entsprechenden htpp-Seiten.

Mich würde jetzt mal interessieren, wie denn Euer Erfolg mit den oben genannten Maßnahmen war:
Hat alles geklappt? Wie lang hat es gedauert bis G die http-Seiten im Index hatte? Waren die http-Seiten genauso gut gerankt?

Vielen Dank, GoSEO

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag