Seite 1 von 2

Frage zur "site:" - Abfrage

Verfasst: 21.04.2004, 06:37
von decision
Kann man google untersagen mit der site: - Abfrage alle Seite anzuzeigen? Z.B. habe ich einige Seiten, z.B. Vorschauseiten (Popups) für Templates, etc. welche nicht unbedingt da zu sehen sein müssen.

Danke

Verfasst:
von

Verfasst: 21.04.2004, 06:43
von UweT
Für solche Fälle gibt es die robots.txt Datei, mit der kannst du verhindern, dass die Vorschauseiten im Index stehen... Ein Filterfunktion allein für die "site:" Abfrage gibt es nicht. Es sei denn jeder tippt ein "site:abc.de -meine-wertvollen-vorschauseiten", dann tauchen die bei "site" auch nicht auf.

gruß
tbone.

Verfasst: 21.04.2004, 08:13
von decision
In meiner robots.txt steht drin das u.a. das Impressum nicht gespidert werden soll, aber mit der Abfrage steht die Seite trotzdem drin. Deswegen frage ich...

Naja, danke dir

Verfasst:
von

Verfasst: 21.04.2004, 11:52
von rfox
Impressum nicht gespidert werden soll
Genau diesen Wunsch hatte ich auch. Die Lösung war folgende: Name, Telefon usw. stehen in einer Grafik. Deren ALT-Text lautet: "Aktivieren Sie bitte die Darstellung von Grafiken, da die rechtlichen Informationen aus Datenschutzgründen nicht automatisch auslesbar sind."

Ich weiß nicht, ob es rechtlich hunderprozentig sicher ist. Aber: Wenn jemand auf Grund einer schlechten Brille meinen Briefkopf nicht richtig entziffern kann, liegt das außerhalb meines Einflusses. Wenn jemand mit einem so alten Browser surft, welcher keine Grafiken anzeigen kann, so kann ich das ebenfalls nicht beeinflussen. Und da das deutsche Recht eigentlich nach gesundem Menschenverstand urteilt, vertraue ich darauf.

Und: Neben der robots.txt stehen dir ja noch <meta> Angaben zur Verfügung (vgl. https://www.google.com/webmasters/3.html#removed).

Verfasst: 21.04.2004, 12:02
von martinanied
Und da das deutsche Recht eigentlich nach gesundem Menschenverstand urteilt, vertraue ich darauf.
Das würde ich mir überlegen, haben schon für Abmahnungen zahlen dürfen wo ich mir das auch gewünscht hätte. :( Vorsicht!!!

Verfasst: 21.04.2004, 12:08
von rfox
Das würde ich mir überlegen, haben schon für Abmahnungen zahlen dürfen wo ich mir das auch gewünscht hätte.
Tja, die Abmahnungen sind ja nicht das letzte Wort. Ich vermute mal, das viele Abmahnungen vor einem Gericht keinen Bestand haben dürften. Aber vielleicht ist das ja auch mein (naiver) Glaube an unser Rechtssystem.

Verfasst: 21.04.2004, 12:11
von sean
wenn es darum geht Spamming zu blockieren, sollte das doch Ok sein. Ich mache das auch, nicht um nicht gespidert zu werden, aber der Spam Anstieg von monatlich + 30% war auf einmal nur noch bei ein paar %.

Die Menge der Webs ist auschlaggebend.

sean

Verfasst: 21.04.2004, 12:28
von IT-Knecht
decision hat geschrieben:In meiner robots.txt steht drin das u.a. das Impressum nicht gespidert werden soll, aber mit der Abfrage steht die Seite trotzdem drin.
<oberlehrer>
Das ist genau genommen unmöglich, weil in der robots.txt nur Verzeichnisse ausgeschlossen werden können, keine einzelnen Dateien.
</oberlehrer>

Entscheidend ist nicht, ob die URL des Impressums bei site: angezeigt wird, der Pfad steht ja auf fast allen Seiten. Entscheidend ist, ob die Inhalte des Impressums in den Index aufgenommen wurden. Kann'ste ja schnell mit ein paar spezifischen Suchworten überprüfen.

Grüße,
Martin

Verfasst: 21.04.2004, 12:35
von IT-Knecht
rfox hat geschrieben:
Impressum nicht gespidert werden soll
Genau diesen Wunsch hatte ich auch. Die Lösung war folgende: Name, Telefon usw. stehen in einer Grafik. Deren ALT-Text lautet: "Aktivieren Sie bitte die Darstellung von Grafiken, da die rechtlichen Informationen aus Datenschutzgründen nicht automatisch auslesbar sind."
BTW: Kennt eigentlich jemand Urteile zu JavaScript-navigierten Impressen/Impressums?

Grüße,
Martin

Verfasst: 21.04.2004, 12:43
von rfox
IT-Knecht hat geschrieben: <oberlehrer>
Das ist genau genommen unmöglich, weil in der robots.txt nur Verzeichnisse ausgeschlossen werden können, keine einzelnen Dateien.
</oberlehrer>
Ich hatte immer schon Spaß daran, meine Lehrer zu korrigieren ;-)
Tut mir leid, aber so wie ich das sehe, geht mit robots.txt noch mehr (vgl. https://www.robotstxt.org/wc/norobots.html#code). Diese Seite wird auch von Google unter folgendem Punkt angegeben: Googlebot isn't obeying my robots.txt file.

Verfasst: 21.04.2004, 12:49
von rfox
IT-Knecht hat geschrieben:BTW: Kennt eigentlich jemand Urteile zu JavaScript-navigierten Impressen/Impressums?
Nicht wirklich direkt auf JS bezogen. Aber hier gibt es eine gute Zusammenfassung bisheriger Urteile zum Impressum: https://www.heyms-drbahr.de/news/news_d ... 03517.html

Verfasst: 21.04.2004, 12:53
von IT-Knecht
rfox hat geschrieben:
IT-Knecht hat geschrieben: <oberlehrer>
Das ist genau genommen unmöglich, weil in der robots.txt nur Verzeichnisse ausgeschlossen werden können, keine einzelnen Dateien.
</oberlehrer>
Ich hatte immer schon Spaß daran, meine Lehrer zu korrigieren ;-)
Tut mir leid, aber so wie ich das sehe, geht mit robots.txt noch mehr (vgl. https://www.robotstxt.org/wc/norobots.html#code). Diese Seite wird auch von Google unter folgendem Punkt angegeben: Googlebot isn't obeying my robots.txt file.
Ooops, sorry, Du hast ja sooo recht. :-?
Trotzdem eine glatte Sechs wegen mangelnder Disziplin!
"Disziplin ist die Kunst, dümmer zu scheinen als der Lehrer"
(frei nach Tucholsky).

Grüße,
Martin

Verfasst: 26.04.2004, 13:48
von decision
@ IT-Knecht
Also wenn ich ein Verzeichnis erstelle, sagen wir "Imp" nenne, darin stecke ich die impressum.html und das Verzeichnis per robots.txt ausschliese. Klappt das dann?

Verfasst: 26.04.2004, 14:27
von rfox
Eigentlich ja. Wenn du zusätzlich die impressum.html mit folgendem Tag versiehst, solltest du auf der sicheren Seite sein:

Code: Alles auswählen

<meta name="robots" content="noindex,nofollow">
Um dich vor SPAM-Sammlern zu schützen, reicht das natürlich nicht aus...

Verfasst: 29.04.2004, 22:23
von IT-Knecht
decision hat geschrieben:@ IT-Knecht
Also wenn ich ein Verzeichnis erstelle, sagen wir "Imp" nenne, darin stecke ich die impressum.html und das Verzeichnis per robots.txt ausschliese. Klappt das dann?
Bei mir klappt es genau so (und direkt soll es ja auch klappen s.o.).
Bei site: wird die URL des Impressums angezeigt, aber die Inhalte (mein Name) sind nicht im Index. (Das EMail-Adressen gegen "böse Bots" extra geschützt werde müssen ist ein anderes Ding.)

Grüße,
Martin