Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Warum ist diese Seite im Index?

Dieses Forum ist für Informationen über Google gedacht (Ausser PageRank!).
Neues Thema Antworten
AndreasR
PostRank 4
PostRank 4
Beiträge: 147
Registriert: 19.06.2006, 19:54
Wohnort: Ruhrgebiet

Beitrag von AndreasR » 05.10.2006, 18:57

Hallo,

https://www.hpv.org/shop/gebraucht/ steht im Index (einfach nach HPV gebraucht suchen).
Aber https://www.hpv.org/robots.txt sagt:

Code: Alles auswählen

User-agent: *
Disallow: *
[...]
DisAllow: /shop/
Eigentlich dürfte wegen der zweiten Zeile in der Datei die gesamte Site nicht im Index sein, warum ist sie es trotzdem?

Gruß, Andreas
Bild
Liegerad-Fernweh

Anzeige von ABAKUS

von Anzeige von ABAKUS »


Hochwertiger Linkaufbau bei ABAKUS:
  • Google-konformer Linkaufbau
  • nachhaltiges Ranking
  • Linkbuilding Angebote zu fairen Preisen
  • internationale Backlinks
Wir bieten Beratung und Umsetzung.
Jetzt anfragen: 0511 / 300325-0

blinkster
PostRank 3
PostRank 3
Beiträge: 96
Registriert: 26.10.2005, 17:41

Beitrag von blinkster » 05.10.2006, 18:59

Nein, ist nicht korrekt. Die zweite Zeile müsste lauten:

Disallow: /

Mit diesem Befehl wird die ganze Seite gesperrt.
Bei Disallow sind keine wildchars (? oder *) erlaubt.
Linktausch oder Ads (20.000 Impressions/Monat)? Mail per PN: Computer/EDV/et cetera
Blinkster.de - yet another computer forum
4 Euro pro 1000 Besucher verdienen

AndreasR
PostRank 4
PostRank 4
Beiträge: 147
Registriert: 19.06.2006, 19:54
Wohnort: Ruhrgebiet

Beitrag von AndreasR » 05.10.2006, 19:22

Hallo Blinkster,
blinkster hat geschrieben:Die zweite Zeile müsste lauten:

Disallow: /
Aber die letztgenannte Zeile müsste doch die genannte URL für Bots sperren...

Gruß, Andreas
Bild
Liegerad-Fernweh

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


blinkster
PostRank 3
PostRank 3
Beiträge: 96
Registriert: 26.10.2005, 17:41

Beitrag von blinkster » 05.10.2006, 19:51

Zeige am besten mal die gesamte robots.txt
Die ist ja jetzt schon mit Fehlern übersäht.
Linktausch oder Ads (20.000 Impressions/Monat)? Mail per PN: Computer/EDV/et cetera
Blinkster.de - yet another computer forum
4 Euro pro 1000 Besucher verdienen

AndreasR
PostRank 4
PostRank 4
Beiträge: 147
Registriert: 19.06.2006, 19:54
Wohnort: Ruhrgebiet

Beitrag von AndreasR » 05.10.2006, 20:02

Code: Alles auswählen

# robots.txt zu http://www.hpv-ev.de/

User-agent: *
Disallow: *

Disallow: /bilder/
Disallow: /cgi-bin/
Disallow: /counter/
Disallow: /download/
Disallow: /kalender/
Disallow: /mitglied/
Disallow: /tmp/
Disallow: /_*/
Disallow: /footer.php
Disallow: /header.php
Disallow: /info.php
Disallow: /fehler.php
Disallow: /kontakt.php
Disallow: /mail.php
DisAllow: /event/
DisAllow: /home/
DisAllow: /links/
DisAllow: /news/
DisAllow: /scene/
DisAllow: /shop/
DisAllow: /technik/
DisAllow: /verein/
Bild
Liegerad-Fernweh

Fridaynite
PostRank 10
PostRank 10
Beiträge: 2983
Registriert: 07.01.2004, 09:10

Beitrag von Fridaynite » 05.10.2006, 20:03

Am besten hier abschreiben:
https://www.robotstxt.org/wc/exclusion.html

Da sind dann wenigstens keine Fehler drin. Alles andere, was sonst so geschrieben wird ist immer mit Vorsicht zu geniessen.

blinkster
PostRank 3
PostRank 3
Beiträge: 96
Registriert: 26.10.2005, 17:41

Beitrag von blinkster » 05.10.2006, 20:17

Also zumindest die Einträge mit den Wildchars, bis auf User-Agent sind falsch und sollten gelöscht werden!

Was aber interessant wäre: Wird die robots case insensitive gecrawlt? Also nicht nur bei den Verzeichnissen, sondern auch bei den Befehlen? -> DisAllow
Linktausch oder Ads (20.000 Impressions/Monat)? Mail per PN: Computer/EDV/et cetera
Blinkster.de - yet another computer forum
4 Euro pro 1000 Besucher verdienen

AndreasR
PostRank 4
PostRank 4
Beiträge: 147
Registriert: 19.06.2006, 19:54
Wohnort: Ruhrgebiet

Beitrag von AndreasR » 05.10.2006, 20:23

Hallo,
blinkster hat geschrieben:Also zumindest die Einträge mit den Wildchars, bis auf User-Agent sind falsch und sollten gelöscht werden!

Was aber interessant wäre: Wird die robots case insensitive gecrawlt? Also nicht nur bei den Verzeichnissen, sondern auch bei den Befehlen? -> DisAllow
Offiziell muss es "Disallow" heißen. Crawler dürfen also case insensitive sein.

Verboten ist die Leerzeile, denn sie kennzeichnet das Ende des Datensatzes. Eigentlich müsste nach einer Leerzeile wieder "User-agent..." kommen oder die Datei zu Ende sein. Die Bots werden vermutlich "Disallow: *" ignorieren und danach gar nichts mehr auswerten.

Im Dunkeln bleibt die Intention der Autoren, denn die Seiten sind für die Zielgruppe durchaus nützlich und der einizge Grund, sie aus dem Index zu nehmen, wären Traffickosten beim Provider. Dann kann man aber gleich die Seiten löschen...

Gruß, Andreas
Bild
Liegerad-Fernweh

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag