Seite 1 von 1

Anweisung in der robots.txt

Verfasst: 16.03.2006, 01:06
von subcordem
n` Abend, ich habe nirgendwo was passendes gefunden:

Auf meiner php-linkdirectory Seite hat man in den Kategorien die Möglichkeit einer Sortierung über einen Link in zb. folgender Art:

kategrie/?s=H

Ist halt übel mit mod_rewrite zugerichtet.

Rafft meinetwegen der Googlebot folgende Anweisung überhaupt?

Code: Alles auswählen

Disallow: /kategorie/?s=H/

oder

Disallow: /kategorie/?s=H
Oder kommt er mit dieser Anweisung nicht klar und hält sich dann womöglich aus der gesamten /kategorie raus?

Verfasst:
von

Anweisung in der robots.txt

Verfasst: 16.03.2006, 10:52
von DiveSurfer
google sollte die sogenannten wildcards unterstützen:

Google unterstützt Wildcards in der robots.txt

Wie es scheint unterstützt Google Wildcards in der robots.txt. Diese Information findet sich auf der Url Removal Seite.

Es ist zum Beispiel möglich alle dynamischen Seiten mit angehängten Url-Parametern mit Hilfe der Wildcard * für Google auszuschließen:

User-agent: Googlebot
Disallow: /*?

Oder wenn man nur Seiten mit bestimmten Parametern ausschließen möchte:

User-agent: Googlebot
Disallow: /*partnerid=

Die Nutzung von Wildcards ist eigentlich nicht im Standard für die robots.txt vorgesehen und wird von anderen Suchmaschinen wohl (leider) nicht unterstützt. Wäre sicherlich begrüßenswert den Standard und die Funktionalität aller Suchmaschinen entsprechend zu erweitern.

Anweisung in der robots.txt

Verfasst: 16.03.2006, 12:09
von axelm
/beispielordner/
bedeutet nur der Ordner die URL

/beispielordner
bedeutet diese URL und alles was sich darunter befindet.

Verfasst:
von

Re: Anweisung in der robots.txt

Verfasst: 16.03.2006, 12:47
von SloMo
axelm hat geschrieben:/beispielordner/
bedeutet nur der Ordner die URL

/beispielordner
bedeutet diese URL und alles was sich darunter befindet.
Irreführend formuliert, finde ich.

/beispielordner/
bedeutet alle Dateien und Ordner unterhalb /beispielordner/

/beispielordner
bedeutet, dass alles, was mit /beispielordner beginnt, nicht verfolgt wird, beispielsweise auch die Pfade /beispielordner.zip, /beispielordner/ und /beispielordner_1/.

In der Robots.txt geht es eigentlich immer nur um den Anfang des Pfades.

Guide to the Robots Exclusion Protocol

Anweisung in der robots.txt

Verfasst: 16.03.2006, 16:48
von subcordem
Das nenne ich ja mal jede Menge Antworten...

Das mit der wildcard hatte ich gestern auch noch per Zufall gefunden.
Dann müsste es wohl so gehen:

Disallow: /*/*?

und da es noch Unterkategorien gibt noch

Disallow: /*/*/*?

Für andere Bots müsste ich dann noch mal sämtliche Kategorien einzeln beim Namen nennen.

Anweisung in der robots.txt

Verfasst: 16.03.2006, 17:13
von SloMo
Die Wildcard-Sache ist nicht dokumentiert. Ich würde nicht mehr als ein einzelnes Wildcard einbauen.

Anweisung in der robots.txt

Verfasst: 16.03.2006, 17:27
von subcordem
Alles klar,bin heute nicht ganz so frisch; stand ja schon weiter oben im thread.

Disallow: /*?

müsste ja demnach für alle Links in samtlichen Ebenen meiner Seite gelten,sobald diese
mit "?" beginnen.

Re: Anweisung in der robots.txt

Verfasst: 16.03.2006, 21:39
von axelm
subcordem hat geschrieben: Disallow: /*?
müsste ja demnach für alle Links in samtlichen Ebenen meiner Seite gelten,sobald diese
mit "?" beginnen.
jo geht mit
domain.de?para=1 und
domain.de/ordner/?para=2
usw.

Anweisung in der robots.txt

Verfasst: 17.03.2006, 17:08
von subcordem
Besten Dank für die aufschlussreichen Worte.