Seite 1 von 1
Ausschließen von Variablen mithilfe von robots.txt
Verfasst: 12.12.2010, 14:08
von critch
Hatte das Problem, dass Google mich durch SessionID´s mit Doppelcontent gelistet hat. Nun habe ich folgende Zeilen in der robots.txt eingetragen - Passt das alles so?
=========================
User-agent: *
Disallow: /autocomplete.php
Disallow: /neuigkeiten.html
Disallow: /*?PHPSESSID=*
Allow: /
=========================
Grüße
Michael
Verfasst: 12.12.2010, 20:52
von tojas
Ob das so passt, hängt von deinen URLs ab.
Ich würde das Ganze mit dem cannonical Tag lösen, das ist sicherer.
sG
tojas
Verfasst: 12.12.2010, 21:01
von critch
Mir gehts nur um die Zeile:
Disallow: /*?PHPSESSID=*
Beispieladresse: https://xxx.de/index.php?PHPSESSID=123456
Verfasst: 13.12.2010, 10:58
von andy12
In der Robots.txt kannst du nur Links ausschließen. Nach dem Fragezeichen werden ausschließlich Parameter übertragen. Damit kannst du aber ganz gut in PHP weiterarbeiten. D. h. das Verbot über ein PHP Script aussprechen. Aber normaler Weise sind Cononical-URLs dafür da das so etwas von Google gar nicht erst indexiert wird. Würde dir raten das einzuschalten bzw. nachträglich in deine Seite zu implementieren. Ist auf lange Sicht die saubere Lösung.
Verfasst: 13.12.2010, 11:15
von critch
Google sagt dazu folgendes:
If Google knows that these pages contain the same content, we may index only one version for our search results. However, you can specify up to 15 parameters you'd like Google to ignore (Google treats these requests as suggestions rather than directives). Ignoring certain parameters can reduce duplicate content in Google's index, and make your site more crawlable. For example, if you specify that the parameter sessionid should be ignored, Google will consider
https://www.example.com/dresses/green.h ... nid=273749 to be the same as
https://www.example.com/dresses/green.htm.
Verfasst: 13.12.2010, 13:25
von chris21
Critch, für Google passt das mit der Robots.txt, wie Du es machst.
Die ignore Geschichte kannst Du in den Webmaster Tools angeben.
Canonical wäre auch eine Idee.
Am Besten wäre aber tatsächlich, die SESSIDs programmatisch serverseitig los zu werden.
Verfasst: 13.12.2010, 13:41
von andy12
chris21 hat geschrieben:
Am Besten wäre aber tatsächlich, die SESSIDs programmatisch serverseitig los zu werden.
Die SessionID sollte auch jede vernünftige CMS oder Shopsoftware heutzutage von selbst verstecken.