in meiner derzeitigen Lernphase rund um die Themen SEO, Google usw. bin ich in den Webmaster Tools gestern bei meinem ersten Internetprojekt auf doppelten Content gestoßen. Im Detail hat sich ein Parameter durch eine ungünstige htaccess Angabe in den Index geschlichen, der exakt die Startseite abbildet:
Was ich bereits umgesetzt habe: https://www.example.org/?p=1 besitzt jetzt als Meta-Angabe "noindex" und "noarchive". Soweit dürfte die URL ja bei einem erneuten Besuch des Crawlers wieder aus dem Index fliegen. Nur wer weiß, wann dieser Besuch stattfindet, da die Seite ja nicht verlinkt ist und durch ihren fast belanglosen Stellenwert sicherlich nur selten erneut aufgerufen wird...
Nun bieten die Webmaster Tools ja die Möglichkeit der Entfernung einer URL an. Leider erhalte ich bei dem obigen Fall allerdings (im Gegensatz zu normalen Unterseiten) immer die Meldung, dass die ganze Website aus dem Index entfernt werden würde. Daher habe ich davon erstmal die Finger gelassen, da ich nichts "riskieren" wollte.
Leider hilft mir auch die Parameter-Behandlung in den Webmaster Tools nicht weiter, da ?p auf meiner Seite durchaus verwendet wird und ich diesen nicht grundsätzlich ausschließen möchte.
Habt ihr noch eine Idee oder heißt es einfach abwarten und Tee trinken?
Diese URL manuell zu entfernen ist absolut unnötig. Solange sie nicht verlinkt ist (auch nicht intern!) könntest du auch einfach gar nichts tun. Sobald du ein paar Links auf https://www.example.org/ wird Google schon klar sein, dass das die korrekte Startseite ist.
Eine 301 Weiterleitung geht leider nicht (weder über htaccess noch php), aber einen rel-canonical bekomme ich durchaus hin. Vielen Dank für den Tipp! Lässt man beim Einbau des letzteren eigentlich dann die "noindex"/"noarchive" Angaben weg oder sollten diese zusätzlich vorhanden sein?
Kleine Frage, die sich mir eben noch beim Besuch der Webmaster Tools stellte: Wenn ich dort eine URL von Hand aus dem Index löschen lasse, bleibt diese dann auch draußen, wenn die Seite plötzlich wieder auf "index" statt "noindex" steht oder nimmt Google diesen Umstand als Anlass meine manuelle Löschung wieder aufzuheben?