robots.txt und metatags

Beitrag von **Fridaynite** » 07.01.2004, 09:21

Habe mich jetzt 2 Stunden durch die Suche gewühlt und unzählige Beiträge gelesen.

Aber jetzt bin ich anscheinend dümmer als vorher.
Daher meine Frage:

Wenn ich die ganzen Seiten einer Domain indizieren lassen will trage ich in die metatags ein:

<meta name="robots" content="INDEX,FOLLOW">

Will ich eine bestimmte Seite dabei ausschliessen trage ich in die robots.txt ein:

#robots.txt
User-agent: *
Disallow: /styles.css
Disallow: /nicht-spidern.php

Will ich den Spider auf die robots.txt lenken trage ich in die metatags ein:

<META NAME="Robots" CONTENT="robots.txt">

Wie verträgt sich jetzt folgender Eintrag in den Metas:

<meta name="robots" content="INDEX,FOLLOW">
<META NAME="siteinfo" CONTENT="robots.txt">

ich blick nicht mehr durch...

Ich will nur eine Seite ausschliessen und den Rest spidern lassen.
Was muss ich richtig machen?

Bitte um Hilfe

von **Anzeige von ABAKUS** »

Hochwertiger Linkaufbau bei ABAKUS:

Google-konformer Linkaufbau
nachhaltiges Ranking
Linkbuilding Angebote zu fairen Preisen
internationale Backlinks

Wir bieten Beratung und Umsetzung.
Jetzt anfragen: 0511 / 300325-0

Beitrag von **mark** » 07.01.2004, 10:28

Moin
Die Spider suchen eigentlich automatisch nach der Datei www.deinedomain.xy/ robots.txt
Darum muß man sich nicht kümmern.

Ich will nur eine Seite ausschliessen und den Rest spidern lassen.
Was muss ich richtig machen?

Die nicht zu spidernde Seite in die robots.txt und dann zusätzlich noch
<meta name="robots" content="NOINDEX">
in die entsprechende Datei.

gruß mark

Beitrag von **Fridaynite** » 07.01.2004, 10:34

ah - dann werd ich das umsetzen.

was mich verwirrt hat, waren die metas auf www.abakus-internet-marketing.de.

da steht nämlich:
<meta name="robots" content="index,follow">
und in der robots.txt werden dann alle möglichen spider von allen möglichen verzeichnissen ausgeschlossen.
das kollidiert doch miteinander, wie ich finde..

von **Anzeige von ABAKUS** »

Content Erstellung von ABAKUS Internet Marketing
Ihre Vorteile:

einzigartige Texte
suchmaschinenoptimierte Inhalte
eine sinnvolle Content-Strategie
Beratung und Umsetzung

Jetzt anfragen: 0511 / 300325-0

Beitrag von **mark** » 07.01.2004, 11:10

Das kollidiert eigentlich nicht.
per robots.txt kann man spider von vornherein aussperren die man nicht haben will, die die dann spidern dürfen sollen auch indizieren und den Links folgen.

gruß mark

Beitrag von **bugscout** » 07.01.2004, 12:37

moin Fridaynite,

<meta name="robots" content="index,follow">
bezieht sich nur auf die seite auf der das steht.

es ist keine anweisung für alle seiten der domain.

grüsse

Beitrag von **Fridaynite** » 07.01.2004, 12:52

moin bugscout,

dann kann man den metaname ja eigentlich komplett weglassen und nur die robots.txt ins verzeichnis stellen.

die sumas wühlen sich dann ja sowieso durch meine links..

Beitrag von **bugscout** » 07.01.2004, 13:20

moin moin,

wenn du jetzt aber für verschiedene seiten verschiedene
anweisungen hast, brauchst du die schon.

<meta name="robots" content="index,follow"> ist standart,
wenn das nicht da steht, macht dich suchmaschine das gleiche.

wenn du jetzt aber ein frame hast und die navigation soll nicht
als suchtreffer erscheinen, aber natürlich die links verfolgt werden,
kommt da <meta name="robots" content="noindex,follow">

grüsse

Beitrag von **Fridaynite** » 07.01.2004, 13:33

nein - ich arbeite schon ewig nicht mehr mit framesets.

mir gehts nur darum, dass ich einzelne redirect-seiten nicht gespidert haben will wegen der externen links darauf. die anderen seiten sollen natürlich alle gefunden werden.
wenn du mir sagst, dass google und co. die robots.txt sowieso findet dann solls mir recht sein.
was sagt denn dann eigentlich dieser tag aus?
<META NAME="siteinfo" CONTENT="robots.txt">

Beitrag von **bull** » 07.01.2004, 18:54

<META NAME="siteinfo" CONTENT="robots.txt">

würd ich weglassen. finde das einen völlig irrelevanten tag. noch nie selbst eingesetzt, und g'bot und consorten kommen trotzdem.

Beitrag von **weltweit** » 08.01.2004, 02:00

Fridaynite hat geschrieben: was sagt denn dann eigentlich dieser tag aus?
<META NAME="siteinfo" CONTENT="robots.txt">

Das ist der Pfad zu deiner robots.txt - Datei. Ich geb den Pfad immer an, kann ja nicht schaden...

...oder was meinen die anderen dazu ?

Beitrag von **viggen** » 09.01.2004, 08:46

ich persönlich habe diesen tag noch nie benützt.

mfg
viggen

Beitrag von **auer** » 09.01.2004, 09:08

Die robots.txt liegt entweder im Wurzelverzeichnis oder es ist nicht 'die robots.txt'.

Offenbar verbreiten sich da merkwürdige Gerüchte, weil irgendjemand mal seine eigenen meta-Tags erfunden hat.

Verbindliche Referenz: https://www.robotstxt.org/wc/exclusion.html

-------
Gruß, Jürgen Auer

Beitrag von **Fridaynite** » 10.01.2004, 10:47

Hab gestern den Content auf den Server geschoben und 3 Links von anderen Domains auf die Startseite gerichtet.
Google war heute nacht da mit 3 Bots und 3 Deepcrawlern anschliessend.
Die einzige Seite die er nicht gespidert hat, war diejenige, die ich gesperrt hatte.
Funzt also.

Danke
Fridaynite.