Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

mod_rewrite und DC und warum kennt google diese Seite?

Ajax, Hijax, Microformats, RDF, Markup, HTML, PHP, CSS, MySQL, htaccess, robots.txt, CGI, Java, Javascript usw.
Neues Thema Antworten
twitch
PostRank 9
PostRank 9
Beiträge: 1222
Registriert: 09.04.2005, 14:01

Beitrag von twitch » 13.02.2007, 12:25

Hallo,

ich sah mir heute mal meien LOG-Files wieder durch und musste mit entsetzten zuschauen, wie der Googlebot einige meiner PHP-Dateien crawlte. :o . Die Seiten haben sgar schon nen Cache bei Google.
Jetzt hab ich na klar muffensausen wegen DC :-).

In der htaccess setzte ich diese PHP-Dateien in html-URL's um.
Dachte ich mir... hm, hab ich wohl irgendwo auf der Seite falsch verlinkt.
Mach ich nen grep "datei" * -r ... findet er nix.
Acuh ne Suche nach möglichen Linkpartnern mit dem falschen Link ergab keine Treffer.

Woher weiß Google, dass die Datei existiert?
htaccess sieht so aus:
RewriteRule ^(produkte/pp)\.html$ produkte/pp.php [QSA,L]

Voll Tatendrang dacht ich mir.. ok, machste ne neue Regel, dass die php-datei auf die html redirected:
RewriteRule ^produkte/pp.php$ https://www.domain.de/produkte/pp.html [L,R=301]

macht er aber nicht. Die Seite läd in einer Schleife.
Wie bekomme ich das hin, dass die Seite automatisch per 301 weitergelitet wird, aber dennoch das URL-Rewriting funktioniert?

Bringt es etwas, wenn ich die php-Dateien per robots.txt auschließe?
m f g
Twitch

SEO - History, Tools, Videos, Downloads und mehr auf https://www.seo-ranking-tools.de/