Seite 1 von 1

RSS Discovery - Seiten nach RSS Feeds checken

Verfasst: 27.02.2006, 18:39
von babasave
Hi zusammen,

weiß jemand von Euch wo ich ein Script finden kann, dass mir Seiten nach RSS Feeds durchsucht? Ich habe eine Version auf Basis von Python gefunden, aber leider hilft mir diese nicht weiter.

Es gibt zwar Seiten a la https://www.blogstreet.com/rssdiscovery.html doch leider kann ich hier jeweils nur eine Seite "crawlen".
~baba

Verfasst:
von

RSS Discovery - Seiten nach RSS Feeds checken

Verfasst: 27.02.2006, 19:18
von Kristian
Hallo
Wie stellst du dir das vor?
Willst du einen Bot einfach auf die Suche ins WWW schicken?
Könnte etwas dauern, bis der mit dem ersten Suchergebnis zurückkommt....
Gruß
Kristian

Verfasst: 27.02.2006, 21:34
von babasave
hi , nope ich hab eine liste von ca 1000 urls die ich eben nicht per hand abarbeiten will ...
hast du eine idee dazu?
~baba

Verfasst:
von

RSS Discovery - Seiten nach RSS Feeds checken

Verfasst: 28.02.2006, 17:16
von Kristian
Hallo

Ich denke da wirst du einen Bot brauchen, der diese 1000 URL's liest, alle Links verfolgt und aus dem Content-Type des verfolgten Links erkennt, ob er gerade einen Feed liest.
(ev. per HEAD-Anfrage, wenn man die Daten nicht braucht)

Content-Type: application/rss+xml;
Content-Type: application/xml;
Content-Type: application/rss+xml;
Content-Type: application/atom+xml;
usw........

Gruss
Kristian

RSS Discovery - Seiten nach RSS Feeds checken

Verfasst: 28.02.2006, 19:13
von mariow
Ungefähr so sollte es sein. Allerdings stehen in der Liste vermutlich nicht direkt die Feeds sondern die Hauptseiten und dort muss der Feed per Discovery, also über den link-tag im Header erkannt werden.

Ein fertiges Tool kenne ich dazu nicht, da kann man aber mit Sicherheit in wenigen Zeilen z.B. in Perl etwas zusammenbasteln.
Alternativ kannst du das python-Tool - sofern das eine einzelne Seite verarbeiten kann - natürliuch auch per Batch auf alle Einträge deiner Liste ansetzen.