Seite 1 von 1

Na SUPER - Google ignoriert ab sofort robots.txt

Verfasst: 02.04.2005, 13:11
von shapeshifter
--> EDIT: hab den Link rausgenommen - der lange Referer von Abakus ging mir aufn Senkel ;)

Fank bleibt: Der Google-Image-Bot ignoriert die robots.txt

------------------------

Geht mir nicht ums Bild, lol - sondern ums Prinzip !

letzte Zeile............ich habs gewusst - client-seitig gibts immer ärger - nur .htaccess hilft !

Verfasst:
von

Verfasst: 02.04.2005, 13:38
von joell
https://www.google.de/remove.html

User-Agent: Googlebot-Image
Disallow: /images/dogs.jpg
Um alle Bilder Ihrer Web-Site aus unserem Index zu entfernen, müssen Sie die folgende robots.txt-Datei in das Root-Verzeichnis Ihres Servers legen:

User-Agent: Googlebot-Image
Disallow: /
Nachdem der Webmaster




... also sperr mal gezielt den google image bot ....

Na SUPER - Google ignoriert ab sofort robots.txt

Verfasst: 02.04.2005, 14:00
von shapeshifter
???
Fällt der Useragent "Googlebot-Image" nicht unter "*"-> wie ALLE ? ;)

Wenn nicht, ist die Technik der robots.txt hinfällig.......

Verfasst: 02.04.2005, 16:33
von bydlo
hallo josef,

sieht ja ganz danach aus. da hilft dann hoffentlich nur htaccess.

jetzt kaper ich mal deinen thread (sorry).
weisst du (oder jemand anders) wie ich rausfinden kann mit welchem suchbegriff
jemand auf eines meiner bilder gestossen ist.
für htmlseiten sagt mir das ja mescalero.
für die images aber nicht.
bin nämlich seit einigen tagen mit 100 bildern in der suche und würde ganz gerne wissen mit welchen KWs die gefunden werden um ev umzubenennen
und etwas besser zu steuern.
gruss axel

Na SUPER - Google ignoriert ab sofort robots.txt

Verfasst: 02.04.2005, 16:38
von shapeshifter
pphlogger ;)
https://pphlogger.phpee.com/
ziemlich geniales und einfach anzuwendendes Tool !

......damit bin ich auch auf mein Google-Bild-Problem gestossen.

Na SUPER - Google ignoriert ab sofort robots.txt

Verfasst: 02.04.2005, 20:16
von shapeshifter
Jetzt sag mir doch endlich mal einer, dass ich was falsch geschrieben oder übersehen habe - kann doch nicht sein, dass Google die robots.txt ab sofort nicht mehr beachtet ?!?!?!??!

Das wär ne ziemliche Katastrophe für Foren mit 302-Weiterleitungen, die ihre outbounds per robots.txt gesperrt haben :o !

Na SUPER - Google ignoriert ab sofort robots.txt

Verfasst: 02.04.2005, 20:34
von Reimer
Gibt ja noch weitere Möglichkeiten um Bots auszusperren. Einfach via mod_rewrite den UserAgent mit einer Fehlermeldung versorgen.

Na SUPER - Google ignoriert ab sofort robots.txt

Verfasst: 02.04.2005, 21:07
von shapeshifter
.........ich beharr ja schon immer auf der .htacess - nur weiger ich mich noch zu akzeptieren, dass ich richtig lag.

Ach - wer von Euch ist denn mit folgender lustiger Config grad bei mir gewesen ?
pD9F61A1E.dip.t-dialin.net - Der derbste UA auf dieser Welt - 1600x1200 - Apr 02, 17:37:37
:D
Der derbste UA auf dieser Welt......auch nicht schlecht !

Na SUPER - Google ignoriert ab sofort robots.txt

Verfasst: 05.04.2005, 15:59
von bull
Googlebot-Image respektiert Anweisungen unter * in robots.txt nach meinen Erfahrungen nicht. --> .htaccess