Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

MSN hält sich nicht an Robots.txt

Alles Rund um Bing, Yahoo! Suche und andere Suchmaschinen.
Neues Thema Antworten
Gerald79
PostRank 4
PostRank 4
Beiträge: 159
Registriert: 15.10.2004, 14:27

Beitrag von Gerald79 » 23.01.2005, 04:05

Hallo,

seid ca 14 Tagen Spidert der MSNBot auf meinen Seiten bzw. in meinen Foren rum.
Was auffällt ist das zwar die Robots.txt gelesen wird aber trotzdem verbotene Seiten gespeidert werden.
Und im Index auftauchten (bei der Suche nach der URL)

Stehe ich hier alleine oder geht euch das Ähnlich???

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


Sephyra
PostRank 2
PostRank 2
Beiträge: 63
Registriert: 23.05.2004, 14:50

Beitrag von Sephyra » 26.05.2005, 11:53

Hallo Gerald,

dein Thread ist zwar schon etwas älter, aber ich hab das gleiche Prob. Seiten sind bei MSN zu finden, die schon immer durch die robots.txt verboten wurden. Die betroffenen Seiten stehen unter

User-agent: *

Das ganze ist reichlich ärgerlich, da es sich um die "Mehrzahl von Impressum" (wie heißt das bloß?) handelt.

Hilarius
PostRank 1
PostRank 1
Beiträge: 26
Registriert: 13.05.2005, 08:30
Wohnort: Region Basel

Beitrag von Hilarius » 26.05.2005, 12:10

Ich kann das bestätigen - reklamiert bitte auch bei den MSN-Leuten!

Sephyra
PostRank 2
PostRank 2
Beiträge: 63
Registriert: 23.05.2004, 14:50

Beitrag von Sephyra » 26.05.2005, 19:29

Hab ich angeschrieben. Zurück kam folgende Anleitung, zwar recht zügig, aber der Service von G. ist eben doch besser.
To remove web pages, be sure to correctly use the "NO INDEX, NO FOLLOW"
metatag in your Web page HTML code. Steps are given below on how you can
prevent your web page from being indexed on the MSN Search engine:

1. Edit the HTML code for the page you don't want indexed.

2. Insert the following metatag in the head section of your Web page:

3. Save the changes to your Web page.

Once the no index tag is placed on a site, our automated MSNBot will see
this and remove the site via automated indexing. If there is no metatag
asking the robot not to index, then the site will continue to be in the
search results.



You may also visit the link below for more information on how to control
which pages of your website are indexed:

https://search.msn.com/docs/siteowner.a ... ToSite.htm


MSNBot uses the robots.txt to determine which pages it will index. After
you add or update a robots.txt file, there may be a delay before MSNBot
indexes the changes.

If you have not added or changed the robots.txt file recently, make sure
that the syntax of your robots.txt file is correct. Also, make sure the
robots.txt file is in your site's top-level (root) web server directory.
MSN Search has comprehensive online help available to you. For more
information about features, functions, and issues, click the "Help" link
at the top of any MSN Search page.

stalker
PostRank 6
PostRank 6
Beiträge: 400
Registriert: 29.01.2004, 18:00

Beitrag von stalker » 26.05.2005, 20:40

vermutlich einfach ein bug der robots.txt interpretation

könntet ihr mal eine robots.txt posten an welche sie der msn bot nicht hält ?

Sephyra
PostRank 2
PostRank 2
Beiträge: 63
Registriert: 23.05.2004, 14:50

Beitrag von Sephyra » 27.05.2005, 10:48

User-agent: *
Disallow: /impressum.phtml

#MSN-Bot zuegeln
User-Agent: msnbot
Crawl-Delay: 60

An der richtigen Stelle liegt die robots.txt auch.

Mit Google hab ich da kein Problem. Die halten sich dran.

Sephyra
PostRank 2
PostRank 2
Beiträge: 63
Registriert: 23.05.2004, 14:50

Beitrag von Sephyra » 25.06.2005, 10:45

Hi,

nach einer Erweiterung sämtlicher robots.txt um dieses:

User-Agent: msnbot
Disallow: /impressum.phtml


scheinen nun alle betroffenen Seiten aus dem MSN-Index verschwunden zu sein.

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag