Wie Seiten bei MSN mit Session-Ids löschen
Verfasst: 28.02.2005, 08:59
Hallo miteinander,
Benutze als Forensoftware Phorum5.
Jetzt hat der MSN im Web einen Link mit einer SessionId aufgeschnappt und spidert mit dieser munter drauf los.
Das Loch ist gestopft. Wie bekomme ich aber diese Seiten wieder aus dem MSM-Index?
Google ist kein Problem, da Google in der robots.txt zum Glück Wildchars unterstützt.
Habe jetzt erst einmal den msnbot vollständig ausgesperrt, damit es nicht noch mehr indizierte Seiten werden.
Die gespeicherten Links sehen wie folgt aus:
Domainname.de/list.php?11,phorum_session_v5=Benutzername%3A9d49552a9f47e7d7......
Domainname.de/read.php?11,60690,60697,phorum_session_v5=Benutzername%3A9d49552...
11 = Forumsnummer
2.Zahl = Thread
3.Zahl = Beitrag
Der Rest sollte raus, da er zu doppeltem Content führt.
Da MSN beim Suchwort EXCEL zwar die qualitativ besseren Ergebnisse liefert, aber sich die Anzahl an Besucher in Grenzen hält, habe ich erst einmal den msnbot per robots.txt ausgesperrt. Wie lange dürfte es dauern bis die Seiten bei MSN nicht mehr gelistet sind?
Die robots.txt sieht momentan so aus:
https://phorum.excelhost.de/robots.txt
Mit der .htaccess könnte ich zwar die mir bekannten falschen Einträge umbiegen, es wären aber hunderte, wenn man die Parameter mit übergeben müsste.
Hat jemand von Euch weitere Ideen?
Danke.
Gruß
Berti
Benutze als Forensoftware Phorum5.
Jetzt hat der MSN im Web einen Link mit einer SessionId aufgeschnappt und spidert mit dieser munter drauf los.
Das Loch ist gestopft. Wie bekomme ich aber diese Seiten wieder aus dem MSM-Index?
Google ist kein Problem, da Google in der robots.txt zum Glück Wildchars unterstützt.
Habe jetzt erst einmal den msnbot vollständig ausgesperrt, damit es nicht noch mehr indizierte Seiten werden.
Die gespeicherten Links sehen wie folgt aus:
Domainname.de/list.php?11,phorum_session_v5=Benutzername%3A9d49552a9f47e7d7......
Domainname.de/read.php?11,60690,60697,phorum_session_v5=Benutzername%3A9d49552...
11 = Forumsnummer
2.Zahl = Thread
3.Zahl = Beitrag
Der Rest sollte raus, da er zu doppeltem Content führt.
Da MSN beim Suchwort EXCEL zwar die qualitativ besseren Ergebnisse liefert, aber sich die Anzahl an Besucher in Grenzen hält, habe ich erst einmal den msnbot per robots.txt ausgesperrt. Wie lange dürfte es dauern bis die Seiten bei MSN nicht mehr gelistet sind?
Die robots.txt sieht momentan so aus:
https://phorum.excelhost.de/robots.txt
Mit der .htaccess könnte ich zwar die mir bekannten falschen Einträge umbiegen, es wären aber hunderte, wenn man die Parameter mit übergeben müsste.
Hat jemand von Euch weitere Ideen?
Danke.
Gruß
Berti