Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

scraping per xpath nicht möglich?

Ajax, Hijax, Microformats, RDF, Markup, HTML, PHP, CSS, MySQL, htaccess, robots.txt, CGI, Java, Javascript usw.
Neues Thema Antworten
einmalseomitallesbitte
PostRank 2
PostRank 2
Beiträge: 40
Registriert: 28.07.2012, 16:07

Beitrag von einmalseomitallesbitte » 03.04.2013, 16:38

Hi,

folgendes Problem: Die Webseite

suite.searchmetrics.com/de/essentials?url=abakus-internet-marketing.de

enthält Werte, die sich scheinbar nicht so einfach scrapen lassen. Wenn ich z.B. den Wert der SEO Visibility haben möchte, kann ich mir dafür einen xpath Pfad vom Browser anzeigen lassen (z.B. mit firebug). Ich kann das Element unter dieser url und diesem Pfad aber trotzdem nicht ansprechen. Im Quelltext findet man auch nur einen äußeren Div. Den gesamten Inhalt des Divs, wozu die ganzen interessierenden Zahlen gehören, sieht man im Quelltext nicht.

Als absoluter Programmierer-Laie würde ich jetzt nur gerne wissen, ob es generell Mittel und Wege gibt, an den Wert ran zu kommen. Was ich dazu können muss und wie aufwändig es ist ;)

Ich hab irgendwo aufgeschnappt, dass es hier um DOM-Manipulation gehen könnte, und ich in diesem Fall "nur" die richtige url rausfinden müsste, über die der Wert abgefragt werden kann. Aber ich hab, wie gesagt nicht so die große Ahnung von der Materie. Kann auch sein, dass ich da was durcheinanderbringe.

Ich will den Wert übrigens per google docs -> importxml() scrapen. Notfalls könnte ich den Import sicher auch per php bewerkstelligen. Das Problem liegt aber glaube ich eher darin, die richtigen Parameter (url und xpath) raus zu bekommen.

Hat jemand ne Idee?