Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Bestimmte Dateien sperren

Ajax, Hijax, Microformats, RDF, Markup, HTML, PHP, CSS, MySQL, htaccess, robots.txt, CGI, Java, Javascript usw.
Neues Thema Antworten
Kali
PostRank 4
PostRank 4
Beiträge: 191
Registriert: 21.04.2005, 17:42

Beitrag von Kali » 15.02.2009, 14:01

Hallo allerseits,
ich bräuchte kurz Eure Hilfe.

Ich würde gerne die Robots.txt bei mir anpassen. Ziel ist es, dass keinerlei PDF indexiert wird von Google und das keinerlei Druckversion indexiert werden. Ersteres bekomme ich ja mit Disallow: /*.pdf$ hin. Aber wie schaffe ich es, dass in jedem Verzeichnis alles gesperrt wird, dass auf drucken.html endet? Beispiele: verzeichnis1/drucken.html, verzeichnis2/drucken.html etc...

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


catcat
PostRank 10
PostRank 10
Beiträge: 10292
Registriert: 02.08.2006, 13:21
Wohnort: Litauen

Beitrag von catcat » 15.02.2009, 14:55

Ich würds mit dem hier mal versuchen (ohne garantie:

Disallow: /*/drucken.html

Kali
PostRank 4
PostRank 4
Beiträge: 191
Registriert: 21.04.2005, 17:42

Beitrag von Kali » 15.02.2009, 15:55

Danke. Ich hatte daran auch schon gedacht. Aber ich fand das nicht in den Standarts von Google und will nicht riskieren, dass dadurch noch mehr nicht indexiert wird. Hat jemand das hier schonmal probiert?

Pompom
PostRank 10
PostRank 10
Beiträge: 3751
Registriert: 10.09.2004, 16:38

Beitrag von Pompom » 15.02.2009, 16:02

Disallow: drucken.html

Kali
PostRank 4
PostRank 4
Beiträge: 191
Registriert: 21.04.2005, 17:42

Beitrag von Kali » 15.02.2009, 17:47

Pompom hat geschrieben:Disallow: drucken.html
Aber rafft der Bot dann, dass es alle drucken.html sind und nicht nur das im Hauptordner?

Pompom
PostRank 10
PostRank 10
Beiträge: 3751
Registriert: 10.09.2004, 16:38

Beitrag von Pompom » 15.02.2009, 18:17

das rafft der, der lebt davon.

Nur der Hauptordner (root) ist
Disallow: /drucken.html

Kali
PostRank 4
PostRank 4
Beiträge: 191
Registriert: 21.04.2005, 17:42

Beitrag von Kali » 16.02.2009, 12:44

Ok Danke :)

Mork vom Ork
PostRank 9
PostRank 9
Beiträge: 2557
Registriert: 08.07.2008, 11:07
Wohnort: Aufm Friedhof.

Beitrag von Mork vom Ork » 16.02.2009, 13:48

Wenn der Googlebot das kann, dann ist das eine nicht dokumentierte Eigenart, denn bei Google steht davon nichts, ganz im Gegenteil wird dort empfohlen, „The entry should begin with a forward slash (/).“
Und allgemein, d.h. für alle Bots gesprochen, wird mit Disallow: drucken.html definitiv gar nichts ausgeschlossen, weil URL-Pfade immer mit einem Schrägstrich beginnen, drucken.html entsprechend dem robots.txt-Standard also auf nichts zutrifft.

Korrekt wäre zumindest im Falle Googlebot nur Folgendes, um sämtliche drucken.html-Seiten des Servers auszuschließen:

User-agent: Googlebot
Disallow: /*drucken.html*

Anderes täte ich mit Vorsicht genießen.

Kali
PostRank 4
PostRank 4
Beiträge: 191
Registriert: 21.04.2005, 17:42

Beitrag von Kali » 17.02.2009, 00:38

Thx.

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag