ich habe da ein Problem, bei dem ich mir nicht ganz sicher bin, was dagegen zu tun ist.
Wir haben eine Website erstellt auf die verschiedene Affiliate Partner verlinken. Ein Partner verlinkt z.B. mit folgender URL auf unserer Webseite: www.oursite.com/?partner=123
Wir verwenden den Parameter einerseits für Statistiken, zum anderen erhalten Internetsurfer die von Partnerseiten kommen spezielle Angebote.
Und da liegt das Problem.
Gibt man im Google den Firmennamen ein (oursite) wird in den Topergebnissen die URL mit der Partner ID hinten dran angezeigt. Das ist denkbar schlecht für uns, da dann jeder der die angezeigte URL aufruft das spezielle Angebot erhält das eingentlich nur von Partnersites kommende User erhalten sollten.
Jetzt die eigentliche Frage:
Nützt es etwas, wenn ich auf oursite.com die URLs die nicht indexiert werden sollen in der robots.txt vom Indexieren ausschließe?
Ich bin mir nicht sicher ob das so funktioniert. Dabei möchte ich auch nicht, dass die Startseite ohne Parameter dann auch nicht mehr indexiert wird.
Ich meine hier mal gelesen zu haben das das mit Parametern in der robots.txt nicht funktioniert? Was du aber zumindest machen kannst ist die unerwünschten Seiten über die Meta-Tags von der Indexierung auszuschließen, das sähe dann so aus:
<meta name="robots" content="noindex">
Ich kann da zwar keine eigenen Erfahrungen vorweisen, aber das wäre ein Anfang. Zur robots.txt kann ja vielleicht noch jemand anderes etwas beisteuern.
Oder Du leitest die Parameter-Links per 301 oder Meta-Refresh weiter auf die parameterfreie URL. Die Partner-ID kannst Du Dir vielleicht per Cookie merken.
Googles Seite ist sehr interessant diesbezüglich.
Auch gleich in deine News übernommen du Fuchs du!
Also meine robots.txt sieht jetzt folgendermaßen aus:
User-agent: *
Disallow: /?partner
Da ja das Fragezeichen ein gültiges Zeichen in einer URL ist, glaube ich, dass ich mit oben angeführter robots.txt alle Bots davon abhalten kann, die URL www.oursite.com/?partner=xxx zu indexieren.
Ich habe nirgends einen Hinweis finden können, dass es so nicht funktionieren wird. Das Fragezeichen ist ja in dem Sinn keine Wildcard und müsste deshalb für alle Bots funktionieren.
Seht ihr das anders?
PS: Hab grad gesehen dass es www.oursite.com wirklich gibt. Wir haben mit der Website natürlich nichts zum tun, war nur so als Beispiel.
Wäre es nicht das einfachste einfach, per Referer zu überprüfen ob der User von Google kommt? So könntest Du zB auch validieren ob er auch von der "richtigen" Partnerseite kommt.