Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

robots.txt wird ignoriert?

Dieses Forum ist für Informationen über Google gedacht (Ausser PageRank!).
mauri
PostRank 8
PostRank 8
Beiträge: 672
Registriert: 15.08.2003, 06:04
Wohnort: Wo es keinen Schnee gibt.

Beitrag von mauri » 22.03.2005, 13:47

mir scheint, du hast zwar html seiten > aber google bekommt immer noch seine sids, somit haut er immer auf die selbe seite> durch den sid, sieht er die selbe andauernd, aber mit immer anderen sids, somit spidert er sich dumm und daemlich an der einen seite.
dein mod ist nicht richtig installiert > schaetze du hast ein teilstueck vergessen und zwar google die sessions zu nehmen.
somit noch mal> ueberpruefe deinen mod, wie und was du installiert hast, schaue nach ob alles stimmt...

Anzeige von ABAKUS

von Anzeige von ABAKUS »


Hochwertiger Linkaufbau bei ABAKUS:
  • Google-konformer Linkaufbau
  • nachhaltiges Ranking
  • Linkbuilding Angebote zu fairen Preisen
  • internationale Backlinks
Wir bieten Beratung und Umsetzung.
Jetzt anfragen: 0511 / 300325-0

SM-Anfaenger
PostRank 2
PostRank 2
Beiträge: 36
Registriert: 16.03.2005, 18:28

Beitrag von SM-Anfaenger » 22.03.2005, 13:50

Ich habe es noch nie geschafft, daß Google wie gewünscht Seiten ignoriert :cry:
wird immer ausgegeben (zwar nur als URL, aber immerhin...)

Eigentlich alles easy HMTL! Wäre dankbar für Hinweise!

In der auszuschließenden Datei w*w.meine-domain.de/verboten1.htm steht bei mir :

<meta name="robots" content="noindex,follow"> oder auch mal
<meta name="robots" content="noindex">

zusätzlich im Rootverzeichnis die robots.txt mit z.B. folgendem Inhalt

User-agent: *
Disallow: /verboten1.htm
Disallow: /verboten2.htm

User-agent: ia_archiver
Disallow: /

User-Agent: Googlebot-Image
Disallow: /

User-agent: MSIECrawler
Disallow: /

User-agent: psbot
Disallow: /

User-agent: TurnitinBot
Disallow: /

Was ist daran falsch, es erscheint bei Google trotzdem
w*w.meine-domain.de/verboten1.htm in den Ergebnissen (nur die URL, kein TITLE etc.).
Ist die Regel, keine Ausnahme. Besonders häufig wohl bei kleineren Framesetteilen [Menüleiste o.ä.]

mauri
PostRank 8
PostRank 8
Beiträge: 672
Registriert: 15.08.2003, 06:04
Wohnort: Wo es keinen Schnee gibt.

Beitrag von mauri » 22.03.2005, 14:08

SM-Anfaenger hat geschrieben:
User-agent: *
Disallow: /verboten1.htm
Disallow: /verboten2.htm
wo liegen denn deine "verboten" seiten?
im root? im folder /verboten ?

lesen:
https://www.searchengineworld.com/robot ... torial.htm
hope it helps