Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Robots.txt für PHPBB mit mod_rewrite

Alles zum Thema: Robots, Spider, Logfile-Auswertung und Reports
Neues Thema Antworten
errormaster
PostRank 1
PostRank 1
Beiträge: 20
Registriert: 11.06.2004, 08:14
Wohnort: Groß-Bieberau

Beitrag von errormaster » 29.11.2004, 18:52

Hallo zusammen....

I know, hier gabs schon mal was zu dem Thema, half aber nix ..

hab ein Problem mit Google und meinem PHPBB Forum ....

Hab darin mod_ewrite an und ne robots.txt die eigentlich den Googlebot aus den dynamischen Seiten (Benutzerprofile [profile.php] usw..) aussperren sollte ...

Leider klappt das aber nicht so wie ich es mir dachte .. Google nimmt weiterhin dynamische Seiten des Forums auf ...

Könnt mir da wer weiterhelfen?

Hier meine robots.txt:

Code: Alles auswählen

User-agent: Googlebot
Allow: /
Disallow: /forum/*?
Disallow: /forum/ptopic*.html
Disallow: /forum/ntopic*.html
Disallow: /forum/ftopic*asc*.html
Disallow: /forum/admin/ 
Disallow: /forum/db/
Disallow: /forum/files/ 
Disallow: /forum/images/ 
Disallow: /forum/includes/ 
Disallow: /forum/language/ 
Disallow: /forum/templates/ 
Disallow: /forum/common.php 
Disallow: /forum/config.php 
Disallow: /forum/groupcp.php 
Disallow: /forum/memberlist.php
Disallow: /forum/mini_cal.php 
Disallow: /forum/profile.php
Disallow: /forum/ranks.php 
Disallow: /forum/search.php
Disallow: /forum/statistics.php 
Disallow: /forum/viewonline.php
Disallow: /forum/login.php

Laut Google sollte eigentlich Disallow: /forum/*? verhindern das dynamische Seiten gespidert werden ... ist aber irgendwie net der Fall ...

URL zum Forum schick ich per PN falls die zur Hilfe benötigt wird.

Grüße vom errormaster

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


Garfield
PostRank 9
PostRank 9
Beiträge: 2182
Registriert: 12.10.2004, 10:22

Beitrag von Garfield » 29.11.2004, 22:40

Wann haste denn die robots.txt reingesetzt ?

Bei mir hat das etwas gedauert, bis das zog, mehrere Wochen. Und die dyn. URLs sind immer noch im Datenbestand, aber ohne Beschreibung mittlerweile.

errormaster
PostRank 1
PostRank 1
Beiträge: 20
Registriert: 11.06.2004, 08:14
Wohnort: Groß-Bieberau

Beitrag von errormaster » 30.11.2004, 00:18

Die robots.txt hab ich vor mehr als ner Woche reingesetzt ...

Die dynamischen URLs sind bei mir ebenfalls ohne Beschreibung drin ... nur die .HTML Dateien haben eine...

Southmedia
PostRank 10
PostRank 10
Beiträge: 7322
Registriert: 20.07.2003, 19:56

Beitrag von Southmedia » 30.11.2004, 00:25

Laut Google sollte eigentlich Disallow: /forum/*? verhindern das dynamische Seiten gespidert werden
Darf man fragen wo du das her hast?

errormaster
PostRank 1
PostRank 1
Beiträge: 20
Registriert: 11.06.2004, 08:14
Wohnort: Groß-Bieberau

Beitrag von errormaster » 30.11.2004, 00:33

Ja klar darfst du:

https://www.google.de/intl/de/webmasters/faq.html

Punkt 12 bei "Fragen zur Googlebot-Technik "

Grüße vom errormaster
---------------------------------------------
www.srnet.de - Webkatalog

Southmedia
PostRank 10
PostRank 10
Beiträge: 7322
Registriert: 20.07.2003, 19:56

Beitrag von Southmedia » 30.11.2004, 01:00

Hui, das kannte ich bisher auch noch nicht. Standard ist es auf jeden Fall nicht, das ist sicher. Aber wenn der Googlebot es laut deren Seite es versteht sollte es schon funktionieren :)

Danke.

Zu deinem Problem nun aber, das wird sich wohl noch eine ganze Zeit lang hinziehen bis was passiert. Aus Erfahrung kann ich dir sagen dass es zwischen 3 Tagen und 3 Monaten gehen kann - purer Zufall.
Vermutlich werden die URLs auch nicht ganz verschwinden sondern die URL wird weiter drin bleiben, allerdings ohne Titel und Beschreibung - und dadurch wird die Seite auch nicht mehr bei Suchabfragen auftauchen. Damit ist die Seite also faktisch nicht mehr im Index.

errormaster
PostRank 1
PostRank 1
Beiträge: 20
Registriert: 11.06.2004, 08:14
Wohnort: Groß-Bieberau

Beitrag von errormaster » 30.11.2004, 01:11

Southmedia hat geschrieben:Hui, das kannte ich bisher auch noch nicht. Standard ist es auf jeden Fall nicht, das ist sicher.
Musste auch ne Weile suchen bis ich es wieder gefunden habe ... Standard sind Platzhalter, laut robotstxt.org, auf jeden Fall generell nicht ...

Danke auf jeden Fall für deine Antwort, dann werd ich mal abwarten ...

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag