Seite 1 von 2

Feed auslesen blockieren - Friendfeed

Verfasst: 06.02.2012, 20:35
von Lilu24
Hallo

Ich habe ein Problem. Friednfeed.com ließt bei mir immer automatisch den Feed aus und postet diesen. Leider hab ich dies nie beauftragt und Friendfeed scheint nicht auf meine Mails zu reagieren.

Was kann ich dagegen tun? Schalte ich den Feed ab wird gar nicht mehr indiziert. Hab jetzt das in die htaccess eingebaut:

order allow,deny
allow from all
deny from .friendfeed.com
deny from 69.63.180.52

Sollte doch eigentlich so funktionieren oder? Leider wurde vorher bei dem letzten Artikel der Artikel wieder bei Friendfeed gepostet. Das schlimme ist dass dieser dann noch vor meinem rankt.

Danke für eurre Hilfe

Verfasst:
von

Verfasst: 06.02.2012, 21:16
von expy
Config ist soweit OK. Frage ist hierbei nur, ob friendfeed.com auch über diese Daten auf Deine Seite zugreift.

Verfasst: 06.02.2012, 21:17
von Lilu24
Wie könnten sie denn noch zugreifen?

Verfasst:
von

Verfasst: 06.02.2012, 21:23
von expy
schau mal hier:

https://friendfeed.com/about/bot

Du musst den Bot blocken.

Verfasst: 07.02.2012, 00:47
von CyberNibbler
Mit folgendem Code kannst du den Friendfeed-Crwaler blocken.


.htaccess

Code: Alles auswählen

BrowserMatchNoCase FriendFeedBot bad_bot
Order Deny,Allow
Deny from env=bad_bot

Verfasst: 07.02.2012, 06:24
von Lilu24
CyberNibbler hat geschrieben:Mit folgendem Code kannst du den Friendfeed-Crwaler blocken.


.htaccess

Code: Alles auswählen

BrowserMatchNoCase FriendFeedBot bad_bot
Order Deny,Allow
Deny from env=bad_bot
Also das rein und mein Code raus oder?

Verfasst: 07.02.2012, 11:31
von Lilu24
Hab jetzt festgestellt, dass es leider nichts bringt und ei Artikel immer noch zu Friendfeed kommen.

Muss der Code an eine bestimmt Stelle? Gibt da am Ende auch ein # END WordPress

Oder gleich am Anfang?

Verfasst: 07.02.2012, 13:01
von CyberNibbler
Lilu24 hat geschrieben:
CyberNibbler hat geschrieben:Mit folgendem Code kannst du den Friendfeed-Crwaler blocken.


.htaccess

Code: Alles auswählen

BrowserMatchNoCase FriendFeedBot bad_bot
Order Deny,Allow
Deny from env=bad_bot
Also das rein und mein Code raus oder?
Richtig. Ersetze meinen Code durch den anderen.
Lilu24 hat geschrieben:Muss der Code an eine bestimmt Stelle?
Die .htaccess packst du am besten in das Root-Verzeichnsi deines Blogs und dort, wo der Feed liegt.
Zum Beispiel:

Code: Alles auswählen

domain.de/blog/
domain.de/blog/feed/

Wenn der Crawler nicht mit dem Http-Agent kommt, kann er allerdings auch nicht geblockt werden.
Kontrolliere die Accesslogs deines Webserver nach den Zugriffen auf deinen Feed.

Verfasst: 07.02.2012, 13:05
von Lilu24
Das ist mir jetzt etwas zu hoch. Keine Ahnung wo ich das nachschauen kann womit er kommt.

Habe den Code so drin und im Root Verzeichniss von Wordüpress. Bringt leider nichts.

Wo es in der htaccess steht ist egal?

Verfasst: 07.02.2012, 13:12
von CyberNibbler
Sofern

Code: Alles auswählen

Order Deny,Allow 
nicht doppelt vorkommt, ist es egal, wo es steht.

Wo liegt dein Feed?
Im Root verzeichnis von wordpress? Oder in einem anderen Ordner?

Wieso gehst du davon aus, dass es nichts bringt?
Das ganze hat natürlich nur Wirkung auf zukünftigen Feed-Content.


Die Logs deines Webservers (üblicherweise Apache) kannst du bei vielen Webspace-Anbieter zum Beispiel im rootverzeichnis der Domain im Ordner "logs" finden.
Wenn nicht, kontaktiere den Support und frage diesen nach den Webserver-Logs.

Verfasst: 07.02.2012, 14:02
von Lilu24
Hallo nochmal. Also hab jetzt erneut alles versucht, sogar so eingefügt:

BrowserMatchNoCase FriendFeedBot bad_bot
order deny,allow
deny from env=bad_bot
deny from 38.99.107.138
deny from 38.99.107.139
deny from 38.99.107.140
deny from 38.99.107.141
deny from 38.99.107.142
deny from 38.99.68.193
deny from 38.99.68.194
deny from 38.99.68.195
deny from 38.99.68.196
deny from 38.99.68.197
deny from 38.99.68.198
deny from 38.99.68.199
deny from 38.99.68.200
deny from 38.99.68.201
deny from 38.99.68.202
deny from 38.99.68.203
deny from 38.99.68.204
deny from 38.99.68.205
deny from 38.99.68.206
deny from 38.104.134.98

Auch sämtliche IP Adressen unter der angeblich Friendfeed indiziert. Bringt aber nicht. Der neue Artikel wurde erneut auch bei Friendsfeed indiziert.

Weiß nicht mehr weiter. Eine access_log habe ich gefunden.

Dort finde ich wenn ich nach Friendfeed suche folgendes:

compatible; FriendFeedBot/0.1; +Http://friendfeed.com/about/bot; 408 subscribers; feed-id=3069307695939197575

Verfasst: 07.02.2012, 16:56
von CyberNibbler
Um die htaccess-Datei auf Funktion zu testen, könntest du ja mal "FriendFeedBot" durch den Namen deines Browsers ersetzen.

Code: Alles auswählen

BrowserMatchNoCase Firefox bad_bot 
oder

Code: Alles auswählen

BrowserMatchNoCase Opera bad_bot 
oder

Code: Alles auswählen

BrowserMatchNoCase Chrome bad_bot 
Je nachdem, welchen Browser du benutzt.
Wenn du solch eine .htaccess online hast, dürftest DU mit deinem Browser auf das Verzeichnis, in dem die .htaccess liegt, nicht mehr zugegreifen können.
Wenn dies nicht der Fall ist, hast du etwas falsch gemacht.

Bedenke nach dem Test, dies umgehend zu ändern, sonst wirst du vermutlich einen großteil der Besucher aussperren.
Lilu24 hat geschrieben: Dort finde ich wenn ich nach Friendfeed suche folgendes:

compatible; FriendFeedBot/0.1; +Http://friendfeed.com/about/bot; 408 subscribers; feed-id=3069307695939197575
Schön. Damit hast du schon mal einen Zugriff des FriendFeedBots ausfindig gemacht. Dazu stehen auch noch Uhrzeit, Datum, angefragte Datei, Dateigröße gesendet, ...

Übrigens sagt der Http-User-Agent-String aus, dass es wohl 408 User gibt, die deinen Feed bei Friendfeed abonniert haben.

Verfasst: 07.02.2012, 17:03
von CyberNibbler
Ich anstelle würde ein Script programmieren, welches 2 Feeds ausliefert.
Einen Feed speziell für Friendfeed und einen anderen Feed für alle anderen.
Für Friendfeed würde ich nur die Titel der Blogbeiträge anzeigen.
So brauchst du nicht auf die über 400-Friendfeed-User verzichten und hast dennoch einen Feed für alle anderen.

Verfasst: 07.02.2012, 18:18
von Lilu24
Also von Friendfeed kommt kein Mensch zu uns. Das kann man sich sparen.

In der htaccess passt alles. Trotzdem kommt der Bot von Friendfeed vorbei.

Wie könnte man den friedfeed noch blocken. Über die htaccess wurde er zumindest nicht. Habe sowohl die Ips drin und ein Bot siehe Beispiel oben.

Noch jemand eine Idee

Verfasst: 07.02.2012, 18:58
von CyberNibbler
@Lilu24
Hast du denn nun deinen eigenen Browser versuchsweise blocken können?