Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Ads crawlen

Ajax, Hijax, Microformats, RDF, Markup, HTML, PHP, CSS, MySQL, htaccess, robots.txt, CGI, Java, Javascript usw.
Neues Thema Antworten
CRogoza
PostRank 1
PostRank 1
Beiträge: 2
Registriert: 02.11.2010, 12:41

Beitrag von CRogoza » 02.11.2010, 13:45

Guten Tag zusammen,

Ziel ist es aus den Suchmaschinen Google, Yahoo und Bing Ad-Anzeigen zu bestimmten Suchwörtern zu crawlen. Zweck ist z. B. der Vergleich der angezeigten Domain und der Domain auf die letztendlich der Redirect passiert. Leider geben die APIs der genannten Suchmaschinen diese nicht her, oder ich finde es nicht in den API Doks. Kurze Tests mit den APIs haben bei den Results die Ads nicht mitgeliefert.
Hat in dem Bereich jemand Erfahrung oder eine Idee, wie das programmatisch am sinnvollsten zu lösen ist? Ein Webcrawler in Java mit Proxyrotation etc. ist schon vorhanden, weitere ETL Prozesse werden ebenfalls in Java umgesetzt.

Danke schon mal für Ideen und Kommentare!

Anzeige von ABAKUS

von Anzeige von ABAKUS »

Content Erstellung von ABAKUS Internet Marketing
Ihre Vorteile:
  • einzigartige Texte
  • suchmaschinenoptimierte Inhalte
  • eine sinnvolle Content-Strategie
  • Beratung und Umsetzung
Jetzt anfragen: 0511 / 300325-0

euroexchange.de
PostRank 6
PostRank 6
Beiträge: 471
Registriert: 02.06.2007, 13:49

Beitrag von euroexchange.de » 02.11.2010, 13:46

Hey.

Versuchs mal mit fgets und preg_match.

$willichhaben = file_get_contents("https://www.abc.de/");

if(strpos($willichhaben,"Anzeige")!==false) {
preg_match_all("=<anzeige>(.*)</anzeige>=siU",$willichhaben,$jetzthabeichs);
Zuletzt geändert von euroexchange.de am 02.11.2010, 13:52, insgesamt 1-mal geändert.

CRogoza
PostRank 1
PostRank 1
Beiträge: 2
Registriert: 02.11.2010, 12:41

Beitrag von CRogoza » 02.11.2010, 13:50

Der Crawler an sich ist schon vorhanden, ebenfalls kann ich auch schon komplett die Ads von Google extrahieren. Nur gibt es bei entsprechender Anzahl an Querys eine Sperre von Google. Darum wäre es sinnvoller über die API zu lösen. Daher die Frage ob jemand bzgl. der API (auch für die anderen Suchmaschinen) Infos hat, die ich noch nicht gefunden habe. Oder wie andere dieses Ziel vielleicht geschickter umgesetzt haben.

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag