Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

korrekte Syntax für robots.txt

Hier können Sie Ihre Fragen zum Thema Suchmaschinenoptimierung (SEO) / Positionierung stellen
Neues Thema Antworten
chrizz
PostRank 10
PostRank 10
Beiträge: 3044
Registriert: 05.07.2006, 10:37
Wohnort: Berlin

Beitrag von chrizz » 03.03.2008, 23:00

Mojn,

ich grübel grad über einer robots.txt Syntax und wie diese interpretiert wird.

Normalerweise werden Verzeichnisse ja mit abschließendem Slash in der robots.tx t angegeben
Disallow: /includes/

Die Angabe von einzelnen Datei ist auch klar:
Disallow: /impressum.html

Ich meine gestern abeer gelesen zu haben, dass wenn das Slash am Ende fehlt sich das ganze so verhält:
Disallow: /includes

Sperrt alles was mit "includes" im Root beginnt, also
- includes.html
- includes-ordner
usw...

Abgesehen davon, dass es nicht dem Standard entspricht: Kann mir jemand sagen, wie sich der GoogleBot und Slurp hier verhalten?

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


huah
PostRank 6
PostRank 6
Beiträge: 429
Registriert: 19.04.2007, 21:56

Beitrag von huah » 04.03.2008, 00:17

Disallow: /includes müsste alles, was includes beinhaltet, ausschliessen.

Disallow: /includes* alles mit includes am Anfang.

https://www.google.com/support/webmaste ... swer=40367

chrizz
PostRank 10
PostRank 10
Beiträge: 3044
Registriert: 05.07.2006, 10:37
Wohnort: Berlin

Beitrag von chrizz » 04.03.2008, 07:55

vielen Dank erstmal für die Antwort...
eine Frage dann aber noch dazu: Wie verhält es sich hiermit:
/*/includes

geht sowas auch? die Webmasterhilfe ist da ja leider sehr dünn...

Letztlich geht es darum zu wissen, auf welche Arten eine URL durch die robots.txt ausgeschlossen werden kann...

cheers

jf
PostRank 1
PostRank 1
Beiträge: 1
Registriert: 04.03.2008, 13:17

Beitrag von jf » 04.03.2008, 13:30

Hallo leute, meine robots.txt datei wird nicht gefunden(ist im Stammverzeichnis). kann mir da jemand helfen?https://www.texasholdemturniere.de

dieappenzeller
PostRank 6
PostRank 6
Beiträge: 360
Registriert: 29.04.2007, 19:24
Wohnort: NW-Mecklbg.

Beitrag von dieappenzeller » 04.03.2008, 13:44

Woran machst du das fest, das sie nicht gefunden wird? Ich konnt sie lesen, steht nur nix drin.
Lieben Gruß
Torsten und die Appenzeller
Alle suchen Links, aber keiner trägt sich hier ein? Merkwürdig!

huah
PostRank 6
PostRank 6
Beiträge: 429
Registriert: 19.04.2007, 21:56

Beitrag von huah » 04.03.2008, 16:09

chrizz hat geschrieben:vielen Dank erstmal für die Antwort...
eine Frage dann aber noch dazu: Wie verhält es sich hiermit:
/*/includes
Müsste fünktionieren - aber probier es doch einfach mit den Webmastertools aus.

np
PostRank 6
PostRank 6
Beiträge: 415
Registriert: 16.08.2006, 15:57

Beitrag von np » 04.03.2008, 17:34

hier Google dazu: https://www.google.com/support/webmaste ... swer=40367

also für den Googelbot müßte es klappen, aber ob auch andere robots anweisungen mit wildchars verarbeiten weiß ich nicht.

chrizz
PostRank 10
PostRank 10
Beiträge: 3044
Registriert: 05.07.2006, 10:37
Wohnort: Berlin

Beitrag von chrizz » 04.03.2008, 21:09

danke erstmal für die Hinweise. GoogleBot würde mir ja auch erstmal reichen...

mercie

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag