korrekte Syntax für robots.txt

Beitrag von **chrizz** » 03.03.2008, 23:00

Mojn,

ich grübel grad über einer robots.txt Syntax und wie diese interpretiert wird.

Normalerweise werden Verzeichnisse ja mit abschließendem Slash in der robots.tx t angegeben
Disallow: /includes/

Die Angabe von einzelnen Datei ist auch klar:
Disallow: /impressum.html

Ich meine gestern abeer gelesen zu haben, dass wenn das Slash am Ende fehlt sich das ganze so verhält:
Disallow: /includes

Sperrt alles was mit "includes" im Root beginnt, also
- includes.html
- includes-ordner
usw...

Abgesehen davon, dass es nicht dem Standard entspricht: Kann mir jemand sagen, wie sich der GoogleBot und Slurp hier verhalten?

von **Anzeige von ABAKUS** »

Beitrag von **huah** » 04.03.2008, 00:17

Disallow: /includes müsste alles, was includes beinhaltet, ausschliessen.

Disallow: /includes* alles mit includes am Anfang.

https://www.google.com/support/webmaste ... swer=40367

Beitrag von **chrizz** » 04.03.2008, 07:55

vielen Dank erstmal für die Antwort...
eine Frage dann aber noch dazu: Wie verhält es sich hiermit:
/*/includes

geht sowas auch? die Webmasterhilfe ist da ja leider sehr dünn...

Letztlich geht es darum zu wissen, auf welche Arten eine URL durch die robots.txt ausgeschlossen werden kann...

cheers

Beitrag von jf » 04.03.2008, 13:30

Hallo leute, meine robots.txt datei wird nicht gefunden(ist im Stammverzeichnis). kann mir da jemand helfen?https://www.texasholdemturniere.de

Beitrag von **dieappenzeller** » 04.03.2008, 13:44

Woran machst du das fest, das sie nicht gefunden wird? Ich konnt sie lesen, steht nur nix drin.

Beitrag von **huah** » 04.03.2008, 16:09

chrizz hat geschrieben:vielen Dank erstmal für die Antwort...
eine Frage dann aber noch dazu: Wie verhält es sich hiermit:
/*/includes

Müsste fünktionieren - aber probier es doch einfach mit den Webmastertools aus.

Beitrag von np » 04.03.2008, 17:34

hier Google dazu: https://www.google.com/support/webmaste ... swer=40367

also für den Googelbot müßte es klappen, aber ob auch andere robots anweisungen mit wildchars verarbeiten weiß ich nicht.

Beitrag von **chrizz** » 04.03.2008, 21:09

danke erstmal für die Hinweise. GoogleBot würde mir ja auch erstmal reichen...

mercie