Seite 1 von 1

Nutch bestimmten Content von der Indexierung ausschließen

Verfasst: 23.06.2010, 10:54
von Firedog
Hallo,

nach mehr als 2 Stunden erfolglosen suchen, schreibe ich nun diesen Beitrag.

Mein Problem ist Folgendes:

Es ist ja möglich Suchmaschinen bestimmte Urls von der Indexierung auszuschließen. Ist dies evtl. auch schon für ein speziell gekennzeichneten Content innerhalb einer Seite möglich? Dies könnte bespielsweise über ein speziellen Html-Kommentar (<!-- noindexing--> bzw. <!-- /noindexing --> realisiert werden.

Gibt es da bereits irgendetwas in diese Richtung? Gibt es vielleicht sogar etwas einheitliches was alle Crwaler akzeptieren? Wie sieht das bei dem Webcrwaler Nutch aus? Gibt es evtl ein Plugin dafür? Oder muss ich mir selsbt eins schreiben.

Gruß Steffen

Verfasst:
von
Content Erstellung von ABAKUS Internet Marketing
Ihre Vorteile:
  • einzigartige Texte
  • suchmaschinenoptimierte Inhalte
  • eine sinnvolle Content-Strategie
  • Beratung und Umsetzung
Jetzt anfragen: 0511 / 300325-0

Re: Nutch bestimmten Content von der Indexierung ausschließe

Verfasst: 23.06.2010, 11:33
von profo
Firedog hat geschrieben:Es ist ja möglich Suchmaschinen bestimmte Urls von der Indexierung auszuschließen. Ist dies evtl. auch schon für ein speziell gekennzeichneten Content innerhalb einer Seite möglich?
Nein, dafür gibt's keinen Standard.
Firedog hat geschrieben:Wie sieht das bei dem Webcrwaler Nutch aus? Gibt es evtl ein Plugin dafür? Oder muss ich mir selsbt eins schreiben.
Ich kenne da nichts, aber das sollte dann ja eine eher kleine Anpassung werden.

Verfasst: 23.06.2010, 16:13
von 1azrael
hmmm. vllt. den content den du nicht indexiert haben willst als iframe einbinden?

Verfasst:
von

Verfasst: 24.06.2010, 08:05
von Nullpointer
content als grafik generieren oder besser per ajax nachladen.
bzgl. nutch gibt es wohl keine integrierte lösung, wenn man diesem ticket folgt:
https://issues.apache.org/jira/browse/NUTCH-585