Seite 1 von 1

robots.txt sinnlos?

Verfasst: 30.11.2009, 18:26
von poolio
Hallo,
meine Frage ist, warum Google meine robots.txt ignoriert.
Im Google Index finden sich eine Anzahl Webseiten, welche ich eigentlich per robots.txt ausgeschlossen hatte.
z.B.
advanced_search.php
create_account.php
usw.
Backlinks gibt es für diese Seiten keine.

Hier meine robots.txt:

Code: Alles auswählen

User-agent: *
Disallow: address_book_process.php 
Disallow: account.php 
Disallow: account_edit.php 
Disallow: account_edit_process.php 
Disallow: account_history.php 
Disallow: account_history_info.php 
Disallow: address_book.php 
Disallow: checkout_process.php 
Disallow: advanced_search.php 
Disallow: advanced_search_result.php 
Disallow: checkout_address.php 
Disallow: checkout_confirmation.php 
Disallow: checkout_payment.php 
Disallow: checkout_success.php 
Disallow: contact_us.php 
Disallow: create_account.php
Disallow: create_account_guest.php  
Disallow: create_account_process.php 
Disallow: create_account_success.php 
Disallow: info_shopping_cart.php 
Disallow: logoff.php
Disallow: password_double_opt.php
Disallow: popup_image.php 
Disallow: popup_search_help.php 
Disallow: privacy.php 
Disallow: product_notifications.php 
Disallow: product_reviews.php 
Disallow: product_reviews_info.php  
Disallow: shipping.php 
Disallow: admin/
Disallow: export/
Disallow: download/ 
Disallow: includes/ 
Disallow: pub/ 
Disallow: media/
Habe ich da etwas falsch gemacht?
Es wäre schön, wenn ihr mir helfen könntet.
Gibt es noch andere Möglichkeiten, eine Seite vom Index aus zu schließen?

Verfasst:
von

Hochwertiger Linkaufbau bei ABAKUS:
  • Google-konformer Linkaufbau
  • nachhaltiges Ranking
  • Linkbuilding Angebote zu fairen Preisen
  • internationale Backlinks
Wir bieten Beratung und Umsetzung.
Jetzt anfragen: 0511 / 300325-0

Verfasst: 30.11.2009, 18:39
von w3news
Bin mir nicht ganz sicher, aber könnte es daran liegen, dass ein / davor muss?
Also zum Beispiel:

Disallow: /advanced_search.php

Auf robotstxt.org sind auf jeden Fall die Beispiele so aufgebaut. ;)

Verfasst: 30.11.2009, 18:44
von poolio
Ja das stimmt :idea: .
Sollte ich eine Änderung riskieren?
Gibt es noch andere Meinungen dazu?

Verfasst:
von

Verfasst: 30.11.2009, 19:24
von luzie
Was heisst "Änderung riskieren"? Deine robots.txt ist einfach falsch (wie schon bemerkt fehlt da der Slash vor den Einträgen), reparier' sie und fertig :lol:

Verfasst: 30.11.2009, 19:53
von webpilot
Du kannst deine robots.txt auch in den Webmastertools testen.

Verfasst: 30.11.2009, 20:48
von poolio
Danke für die Hilfe

Verfasst: 02.12.2009, 17:57
von euroboy
Ich meine irgendwo gehört zu haben, dass der Googlebot persönlich angesprochen werden will, also mit

User-agent: Googlebot

Jedenfalls mache ich es so und Google scheint die robots.txt zu beachten.
_________________
Suche Links mit Trust (keine Miete), Thema egal - Angebote per PM

Verfasst: 02.12.2009, 20:53
von mano_negra
trotzdem häufen sich die beschwerden in letzter zeit, dass google sich nicht an die robot.txt hält

Verfasst: 02.12.2009, 23:08
von Mork vom Ork
euroboy hat geschrieben:Ich meine irgendwo gehört zu haben, dass der Googlebot persönlich angesprochen werden will, also mit User-agent: Googlebot
Nein. Da hat jemand die Funktionen der robots.txt nicht verstanden bzw. falsch umgesetzt und sich dann irgendwas zusammengereimt.
mano_negra hat geschrieben:trotzdem häufen sich die beschwerden in letzter zeit, dass google sich nicht an die robot.txt hält
Bei der Durchdringung des Webs, die Google bietet, müsste es nicht nur eine Häufung geben, sondern hunderttausende, wenn nicht Millionen Beschwerden. Und mit Verlaub: Wenn ich vermuten sollte, wer einen Fehler macht, der Google-Heini mit den 150.000 US$ Jahresgehalt oder der SEO-Seitenfrickler, dann fällt meine Wahl ohne Zögern auf letzteren.
Die Fehler liegen mit Sicherheit auf Anwenderseite, seien es falsche robots.txt, seien es die Nur-URL-Einträge (ohne indizierten Seiteninhalt), sei es die Tatsache, das Google verschiedene Bots für verschiedene Bereiche hat oder auch, dass Google Seiten auf Wunsch eines Google-Benutzers abruft. Ich habe heute gerade irgendwas von einer einer personalisierten Startseite gelesen, die so einen Zugriff von Google erzeugt, aber nichts mit dem Googlebot zu tun hat und sich dementsprechend auch nicht um die robots.txt kümmert.

Verfasst: 03.12.2009, 00:08
von Vegas
mano_negra hat geschrieben:trotzdem häufen sich die beschwerden in letzter zeit, dass google sich nicht an die robot.txt hält
Wenn man alles richtig macht, funktioniert die robots.txt fein, was aber nicht heißt, daß Google die "verbotenen" Seiten nicht aufruft, sie landen lediglich nicht im Index. So eigenet sie sich z.B. nicht zum Verschleiern von Footprints bestimmter Scripte.

Mork hat sicher Recht, selbst bei Seiten größerer Firmen sieht man teilweise vollkommen falsche robots.txt Dateien. Ähnlich .htaccess, auch hier wird viel gejammert und in den meisten Fällen werden einfach Zeichen vergessen (gerne auch ein Slash) oder der Syntax ist schlicht weg falsch.