Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Suche Parser um Inhalt einer Seite festzustellen

Hier können Sie Ihre Fragen zum Thema Suchmaschinenoptimierung (SEO) / Positionierung stellen
Neues Thema Antworten
Luigi
PostRank 5
PostRank 5
Beiträge: 215
Registriert: 24.11.2005, 11:36

Beitrag von Luigi » 25.01.2008, 18:44

Hallo!
Ich suche einen Parser für eine Suchmaschine, der den Inhalt einer Webseite feststellt und in eine Datenbank packt.

Ein System, vergleichbar mit Google, das mir sagt, dass auf der Webseite xy ein Text zum Thema Handy, Klingeltöne etc. steht.

Gibt es sowas als Script oder so?

Gruß
Lugii

Anzeige von ABAKUS

von Anzeige von ABAKUS »

Content Erstellung von ABAKUS Internet Marketing
Ihre Vorteile:
  • einzigartige Texte
  • suchmaschinenoptimierte Inhalte
  • eine sinnvolle Content-Strategie
  • Beratung und Umsetzung
Jetzt anfragen: 0511 / 300325-0

Kristian
PostRank 9
PostRank 9
Beiträge: 1484
Registriert: 20.07.2005, 16:30

Beitrag von Kristian » 25.01.2008, 19:11

Hallo
Luigi hat geschrieben:Hallo!
Ich suche einen Parser für eine Suchmaschine, der den Inhalt einer Webseite feststellt und in eine Datenbank packt.

Ein System, vergleichbar mit Google, das mir sagt, dass auf der Webseite xy ein Text zum Thema Handy, Klingeltöne etc. steht.

Gibt es sowas als Script oder so?

Gruß
Lugii
Aber ja, da gibt es reichlich Scripte und Ansätze.
Solange es sich um eine Webseite handelt, wie du sagst, kann man jedes davon uneingeschränkt empfehlen.
Falls es mal mehr als eine Seite wird solltest du mal hinterfragen, wie es mit der Rechenleistung bei G. aussieht.

Gruss
Kristian

Luigi
PostRank 5
PostRank 5
Beiträge: 215
Registriert: 24.11.2005, 11:36

Beitrag von Luigi » 25.01.2008, 20:41

Es wäre größenwahnsinnig sich mit Google zu messen.
Ich möchte lediglich ein paar hundert einzelseiten crawlen.

Welches Script ist denn vielversprechend?

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


800XE
PostRank 10
PostRank 10
Beiträge: 5223
Registriert: 02.12.2004, 03:03

Beitrag von 800XE » 25.01.2008, 20:51

Code: Alles auswählen



function text_cut($text, $from, $to,$replace='')
{
  $cut='';
  $pos1  = strpos($text,$from);
  if ( $pos1 )
  {
    $pos2  = strpos($text,$to,$pos1);
    if ( $replace )
      return(substr($text,0,$pos1).$replace.substr($text,$pos2+1));
    if ( $pos2 )
      $cut = substr($text,$pos1,$pos2-$pos1+1);
  }
  return($cut);
}
function text_cutcontent($text, $from, $to)
{
  $cut='';
  $pos1  = strpos($text,$from);
  if ( $pos1 )
  {
    $pos2  = strpos($text,$to,$pos1);
    $pos1 += strlen($from);
    if ( $pos2 )
      $cut = substr($text,$pos1,$pos2-$pos1);
  }
  return($cut);
}
function text_replace($text, $cut, $replace)
{
  return(str_replace($cut,$replace,$text));
}

$buffer = file_get_contents( $http );
$body = text_cutcontent&#40; $buffer, '<bod', '</bod'&#41;;
$contentBodyStart=strpos&#40;$body,'>'&#41;;
$content = substr&#40; $body, $contentBodyStart+1&#41;;



bennos
PostRank 9
PostRank 9
Beiträge: 1299
Registriert: 16.12.2005, 11:51

Beitrag von bennos » 25.01.2008, 21:02

Hallo

Es gibt im OpenSource Bereich einige interessante Projekte die das können.

Lucene
Nutch
mnoGoSearch

und noch viele mehr

gruss
bennos

uwew
PostRank 5
PostRank 5
Beiträge: 297
Registriert: 01.08.2005, 10:29
Wohnort: 36124 Eichenzell

Beitrag von uwew » 25.01.2008, 22:30

Ganz einfach gehts auch mit wget -r , allerdings ohne Datenbank.
Mein neuer Artikel : Von 0 auf 1000 Besucher pro Blogpost in einem neuen Blog.

ff-webdesigner
PostRank 6
PostRank 6
Beiträge: 433
Registriert: 30.01.2004, 07:34
Wohnort: Regensburg

Beitrag von ff-webdesigner » 26.01.2008, 08:25

ich hab da auchmal ein skript gebastelt, das die google serps durchgeht und dann von den einzelnen seiten inhalte saugt - selbstverständlich nur zu demozwecken :-) bei interesse:pn
ff-webdesigner.de: Webdesign aus Regensburg und München

Suche keine Linkpartner oder indische SEOs!

Luigi
PostRank 5
PostRank 5
Beiträge: 215
Registriert: 24.11.2005, 11:36

Beitrag von Luigi » 26.01.2008, 08:31

Ich will nichts runterladen oder saugen, ich möchte die zu durchsuchenden Webseiten lediglich inhaltlich klassifizieren.

Ich dachte eher an sowas wie https://developer.yahoo.com/search/cont ... ction.html

LEider funzt das Teil nicht so gut in Germany und vergleichbares scheint es nicht zu geben.

Luigi

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag