Seite 1 von 1
robots.txt
Verfasst: 17.06.2003, 13:19
von telefonmann
ich habe heute zum ersten mal eine robots.txt erstellt
https://www.abakus-internet-marketing.d ... -tools.htm
ein paar fragen habe ich dazu noch:
1. werden bestimmte datei-typen grundsaetzlich nicht gespidert?
2. wenn ich ein komplettes verzeichnis vebiete, kann ich einzelne dateien daraus davon ausnehmen?
3. wirkt sich die robots.txt positiv auf das ranking der seite aus?
danke
gruesse
der telefonmann
Verfasst:
von
SEO Consulting bei
ABAKUS Internet Marketing Erfahrung seit 2002
- persönliche Betreuung
- individuelle Beratung
- kompetente Umsetzung
Jetzt anfragen:
0511 / 300325-0.
Verfasst: 17.06.2003, 15:33
von Noki
zu 1.) Das hängt von der Suchmaschine ab, aber grundsätzlich ja, denn eine Bildsuchmaschine wird besitmmt keine PDF-Dateien spidern und Word und Exel-Dateien Spidern die meisten Suchmaschine auch nicht genau wie Archiv und ausführbare Dateien, aber drauf verlassen würde ich mich nicht
zu 2.) soweit ich weis nicht, du mußt dann die Dateien verbieten und den rest freilassen, ansonsten könnte man die robots.txt ja als alternative Sitemap nutzen
zu 3.) Das kommt ganz drauf an, die robots.txt ist in erster Linie dazu gedacht Spider zuzulassen oder auszusperren, und hat vom Grundsatz her nichts mit dem Ranking zu tun. Wenn du jedoch mittels robots.txt alle Spider aussperrst dann wird sich das ganze natürlich negativ auswirken. Ich habe aber mal gehört das es auch Spider gibt die nur Seiten spidern die eine robots.txt besitzen, sind aber nicht allzuviele und vorallem nicht die großen und relevanten.
> tobias
Verfasst: 17.06.2003, 17:29
von viggen
Google spidered exel, pdf und word dateien, man kann sogar gezielt in "erweiterte suche" danach suchen.
cheers
viggen
Verfasst: 15.12.2003, 09:52
von Klaus
Moin.
Was ist eigentlich, wenn man keine robots.txt im Verzeichnis hat?
(Wollte bis dato nicht aussperren, nur Test-Domain.)
Code: Alles auswählen
64.68.82.54 - - [14/Dec/2003:12:00:48 +0100] "GET /robots.txt HTTP/1.0" 404 - "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"
64.68.82.54 - - [14/Dec/2003:12:00:49 +0100] "GET / HTTP/1.0" 200 40489 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"
Das ist das Ergebnis.
Okay, 404 ist klar, weil eben nicht vorhanden. Aber 40489?
Weiß das jemand?
Verfasst: 15.12.2003, 10:30
von Halli
Klaus,
der zweite Aufruf sieht mir danach aus, dass dann Deine Domain aufgerufen wurde. Und die '40489' müßte die Größe Deiner Startseite in Byte sein.
Mehr zu Logfiles findest Du in unserem
Internet-Lexikon, Stichwort: Logfiles
Verfasst: 15.12.2003, 10:38
von Klaus
Hallo Halli.
Recht hast Du.
Danke.
