robots.txt - Wiederspruch?
Verfasst: 27.08.2004, 13:05
Hallo,
ich möchte bald mit meinem Forum online gehen und die Themen per mod_rewrite auf .html umschreiben, da ich aber nicht möchte, dass Google das ganze Forumscript, sondern nur die umgeschriebenen .html - Dateien lesen kann, habe ich folgendes gedacht:
- Forumscript in https://www.domain.de/forum/
- Themen (mittels mod_rewrite) https://www.domain.de/thema-1.html (verweist auf https://www.domain.de/forum/thema.php?id=1)
- Google mittels robots.txt von /forum/ ausperren
In den mod_rewrite umgeschriebenen Themen bräuchte ich natürlich im Header:
damit die images und css funktioniert. Nun aber meine Frage, wie verhält sich das bei Google? Die ganzen Images (in einem Forum doch recht viele) darf er gar nicht aufrufen, weil sie in /forum/images/ liegen, welches ich mittels der robots.txt sperre. Bekommt Google dann die Meldung 404 für jedes Image (könnte doch für das Ranking schädlich sein, oder?) ... oder ist Google das egal (ich sprech vom normalen Bot, nicht den Image-Bot).
Und da ich AdSense einsetzen möchte, würde ich den MediaBot nicht einschränken. Der könnte also mehr spidern als der normale GoogleBot ... könnte das zu einem Konflikt werden? Würde dann Google auch die Seiten, welche er durch den Mediabot kennt im Index auflisten?
Und kennt jemand eine besser Möglichkeit wegen den images, weil ich eigentlich nicht auf den google image bot nicht verzichten möchte ...?
ich möchte bald mit meinem Forum online gehen und die Themen per mod_rewrite auf .html umschreiben, da ich aber nicht möchte, dass Google das ganze Forumscript, sondern nur die umgeschriebenen .html - Dateien lesen kann, habe ich folgendes gedacht:
- Forumscript in https://www.domain.de/forum/
- Themen (mittels mod_rewrite) https://www.domain.de/thema-1.html (verweist auf https://www.domain.de/forum/thema.php?id=1)
- Google mittels robots.txt von /forum/ ausperren
In den mod_rewrite umgeschriebenen Themen bräuchte ich natürlich im Header:
Code: Alles auswählen
<base href="http://www.domain.de/forum/">
Und da ich AdSense einsetzen möchte, würde ich den MediaBot nicht einschränken. Der könnte also mehr spidern als der normale GoogleBot ... könnte das zu einem Konflikt werden? Würde dann Google auch die Seiten, welche er durch den Mediabot kennt im Index auflisten?
Und kennt jemand eine besser Möglichkeit wegen den images, weil ich eigentlich nicht auf den google image bot nicht verzichten möchte ...?