Duplicate Content aus dem Index loswerden
Verfasst: 08.03.2012, 19:57
Hallo in die Runde,
habe ein Problem mit einem Shop: Versehentlich ist jede Menge DC entstanden und auch von Google indexiert worden. Die Site-Abfrage liefert viel mehr Seiten, als es eigentlich sein dürften. Es wurden jetzt schon folgende Maßnahmen ergriffen:
Sämtliche Seiten, die als DC zu betrachten sind, haben ein "noindex" im Header.
Links, die auf die DC-Seiten weisen, haben ein rel=noindex bekommen.
Alles, was als DC zu betrachten ist, wurde durch die robots.txt gesperrt.
Nun aber die Frage: Wie bekomme ich die ganzen URL's aus dem Google Index. Habe ein paar URL's über die URL-Entfernung in den Webmaster-Tools gelöscht - hat funktioniert. Am nächsten Tag wieder weiter gelöscht - dieses mal aber am Folgetag keine Veränderung (warum sind die gelöschten URL's nicht weg, geht doch normalerweise recht schnell). Vielleicht kann das aber auch einfach mal ein bisschen länger dauern?
Habe noch andere Ideen, das los zu werden - z.B. den Code, der den DC verursacht herausnehmen und die URL's, die dann immer noch abgerufen werden können, per mod_rewrite auf eine 404-Seite umleiten. Aber ob das hilft?
Also - gibt's jemanden, der Erfahrung damit hat? Was hilft zuverlässig und effizient, um den ganzen Duplicate-Content los zu werden. Die Seite hat natürlich mit 99%iger Wahrscheinlichkeit einen entsprechenden Filter und der soll so schnell wie möglich verschwinden.
Würde mich über Hilfe in dieser Sache freuen. Experimentieren dauert einfach zu lang.
habe ein Problem mit einem Shop: Versehentlich ist jede Menge DC entstanden und auch von Google indexiert worden. Die Site-Abfrage liefert viel mehr Seiten, als es eigentlich sein dürften. Es wurden jetzt schon folgende Maßnahmen ergriffen:
Sämtliche Seiten, die als DC zu betrachten sind, haben ein "noindex" im Header.
Links, die auf die DC-Seiten weisen, haben ein rel=noindex bekommen.
Alles, was als DC zu betrachten ist, wurde durch die robots.txt gesperrt.
Nun aber die Frage: Wie bekomme ich die ganzen URL's aus dem Google Index. Habe ein paar URL's über die URL-Entfernung in den Webmaster-Tools gelöscht - hat funktioniert. Am nächsten Tag wieder weiter gelöscht - dieses mal aber am Folgetag keine Veränderung (warum sind die gelöschten URL's nicht weg, geht doch normalerweise recht schnell). Vielleicht kann das aber auch einfach mal ein bisschen länger dauern?
Habe noch andere Ideen, das los zu werden - z.B. den Code, der den DC verursacht herausnehmen und die URL's, die dann immer noch abgerufen werden können, per mod_rewrite auf eine 404-Seite umleiten. Aber ob das hilft?
Also - gibt's jemanden, der Erfahrung damit hat? Was hilft zuverlässig und effizient, um den ganzen Duplicate-Content los zu werden. Die Seite hat natürlich mit 99%iger Wahrscheinlichkeit einen entsprechenden Filter und der soll so schnell wie möglich verschwinden.
Würde mich über Hilfe in dieser Sache freuen. Experimentieren dauert einfach zu lang.