Seite 1 von 1

Robots.txt für PHPBB mit mod_rewrite

Verfasst: 29.11.2004, 18:52
von errormaster
Hallo zusammen....

I know, hier gabs schon mal was zu dem Thema, half aber nix ..

hab ein Problem mit Google und meinem PHPBB Forum ....

Hab darin mod_ewrite an und ne robots.txt die eigentlich den Googlebot aus den dynamischen Seiten (Benutzerprofile [profile.php] usw..) aussperren sollte ...

Leider klappt das aber nicht so wie ich es mir dachte .. Google nimmt weiterhin dynamische Seiten des Forums auf ...

Könnt mir da wer weiterhelfen?

Hier meine robots.txt:

Code: Alles auswählen

User-agent: Googlebot
Allow: /
Disallow: /forum/*?
Disallow: /forum/ptopic*.html
Disallow: /forum/ntopic*.html
Disallow: /forum/ftopic*asc*.html
Disallow: /forum/admin/ 
Disallow: /forum/db/
Disallow: /forum/files/ 
Disallow: /forum/images/ 
Disallow: /forum/includes/ 
Disallow: /forum/language/ 
Disallow: /forum/templates/ 
Disallow: /forum/common.php 
Disallow: /forum/config.php 
Disallow: /forum/groupcp.php 
Disallow: /forum/memberlist.php
Disallow: /forum/mini_cal.php 
Disallow: /forum/profile.php
Disallow: /forum/ranks.php 
Disallow: /forum/search.php
Disallow: /forum/statistics.php 
Disallow: /forum/viewonline.php
Disallow: /forum/login.php

Laut Google sollte eigentlich Disallow: /forum/*? verhindern das dynamische Seiten gespidert werden ... ist aber irgendwie net der Fall ...

URL zum Forum schick ich per PN falls die zur Hilfe benötigt wird.

Grüße vom errormaster

Verfasst:
von

Verfasst: 29.11.2004, 22:40
von Garfield
Wann haste denn die robots.txt reingesetzt ?

Bei mir hat das etwas gedauert, bis das zog, mehrere Wochen. Und die dyn. URLs sind immer noch im Datenbestand, aber ohne Beschreibung mittlerweile.

Verfasst: 30.11.2004, 00:18
von errormaster
Die robots.txt hab ich vor mehr als ner Woche reingesetzt ...

Die dynamischen URLs sind bei mir ebenfalls ohne Beschreibung drin ... nur die .HTML Dateien haben eine...

Verfasst: 30.11.2004, 00:25
von Southmedia
Laut Google sollte eigentlich Disallow: /forum/*? verhindern das dynamische Seiten gespidert werden
Darf man fragen wo du das her hast?

Verfasst: 30.11.2004, 00:33
von errormaster
Ja klar darfst du:

https://www.google.de/intl/de/webmasters/faq.html

Punkt 12 bei "Fragen zur Googlebot-Technik "

Grüße vom errormaster

Verfasst: 30.11.2004, 01:00
von Southmedia
Hui, das kannte ich bisher auch noch nicht. Standard ist es auf jeden Fall nicht, das ist sicher. Aber wenn der Googlebot es laut deren Seite es versteht sollte es schon funktionieren :)

Danke.

Zu deinem Problem nun aber, das wird sich wohl noch eine ganze Zeit lang hinziehen bis was passiert. Aus Erfahrung kann ich dir sagen dass es zwischen 3 Tagen und 3 Monaten gehen kann - purer Zufall.
Vermutlich werden die URLs auch nicht ganz verschwinden sondern die URL wird weiter drin bleiben, allerdings ohne Titel und Beschreibung - und dadurch wird die Seite auch nicht mehr bei Suchabfragen auftauchen. Damit ist die Seite also faktisch nicht mehr im Index.

Verfasst: 30.11.2004, 01:11
von errormaster
Southmedia hat geschrieben:Hui, das kannte ich bisher auch noch nicht. Standard ist es auf jeden Fall nicht, das ist sicher.
Musste auch ne Weile suchen bis ich es wieder gefunden habe ... Standard sind Platzhalter, laut robotstxt.org, auf jeden Fall generell nicht ...

Danke auf jeden Fall für deine Antwort, dann werd ich mal abwarten ...