mod_rewrite und DC und warum kennt google diese Seite?
Verfasst: 13.02.2007, 12:25
Hallo,
ich sah mir heute mal meien LOG-Files wieder durch und musste mit entsetzten zuschauen, wie der Googlebot einige meiner PHP-Dateien crawlte.
. Die Seiten haben sgar schon nen Cache bei Google.
Jetzt hab ich na klar muffensausen wegen DC
.
In der htaccess setzte ich diese PHP-Dateien in html-URL's um.
Dachte ich mir... hm, hab ich wohl irgendwo auf der Seite falsch verlinkt.
Mach ich nen grep "datei" * -r ... findet er nix.
Acuh ne Suche nach möglichen Linkpartnern mit dem falschen Link ergab keine Treffer.
Woher weiß Google, dass die Datei existiert?
htaccess sieht so aus:
RewriteRule ^(produkte/pp)\.html$ produkte/pp.php [QSA,L]
Voll Tatendrang dacht ich mir.. ok, machste ne neue Regel, dass die php-datei auf die html redirected:
RewriteRule ^produkte/pp.php$ https://www.domain.de/produkte/pp.html [L,R=301]
macht er aber nicht. Die Seite läd in einer Schleife.
Wie bekomme ich das hin, dass die Seite automatisch per 301 weitergelitet wird, aber dennoch das URL-Rewriting funktioniert?
Bringt es etwas, wenn ich die php-Dateien per robots.txt auschließe?
m f g
Twitch
ich sah mir heute mal meien LOG-Files wieder durch und musste mit entsetzten zuschauen, wie der Googlebot einige meiner PHP-Dateien crawlte.

Jetzt hab ich na klar muffensausen wegen DC

In der htaccess setzte ich diese PHP-Dateien in html-URL's um.
Dachte ich mir... hm, hab ich wohl irgendwo auf der Seite falsch verlinkt.
Mach ich nen grep "datei" * -r ... findet er nix.
Acuh ne Suche nach möglichen Linkpartnern mit dem falschen Link ergab keine Treffer.
Woher weiß Google, dass die Datei existiert?
htaccess sieht so aus:
RewriteRule ^(produkte/pp)\.html$ produkte/pp.php [QSA,L]
Voll Tatendrang dacht ich mir.. ok, machste ne neue Regel, dass die php-datei auf die html redirected:
RewriteRule ^produkte/pp.php$ https://www.domain.de/produkte/pp.html [L,R=301]
macht er aber nicht. Die Seite läd in einer Schleife.
Wie bekomme ich das hin, dass die Seite automatisch per 301 weitergelitet wird, aber dennoch das URL-Rewriting funktioniert?
Bringt es etwas, wenn ich die php-Dateien per robots.txt auschließe?
m f g
Twitch