Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Google Seite parsen

Ajax, Hijax, Microformats, RDF, Markup, HTML, PHP, CSS, MySQL, htaccess, robots.txt, CGI, Java, Javascript usw.
Neues Thema Antworten
AGB
PostRank 5
PostRank 5
Beiträge: 205
Registriert: 28.11.2005, 15:23

Beitrag von AGB » 16.01.2007, 11:21

Hallo,

kann mir jemand sagen, wie ich eine Google Ergebnisseite am besten parsen kann? Ich möchte in den organischen Ergebnissen die Position von bestimmten Domains auslesen. Was ich im Netz gefunden habe, war wohl veraltet und funktioniert nicht mehr.



Disclaimer: Natürlich ist mir klar, dass das gegen die Regeln von Google verstößt, automatische Abfragen nicht über die API durchzuführen. Es geht hier nur um das automatische parsen von manuell abgerufenen und gespeicherten Ergebnisseiten.

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


Anonymous

Beitrag von Anonymous » 16.01.2007, 11:56

schau dir die "veralteten" scripte mal an, an der Technik selber hat sich grundlegend nichts geändert.... aber es hat sich wohl im HTML von Google etwas geändert und so stimmen die regexpr nicht mehr...

AGB
PostRank 5
PostRank 5
Beiträge: 205
Registriert: 28.11.2005, 15:23

Beitrag von AGB » 16.01.2007, 12:01

Genau das ist ja der Knackpunkt. Nach welchen Mustern soll ich die Seite jetzt parsen und wie sieht der Reguläre Ausdruck dazu aus?

Anonymous

Beitrag von Anonymous » 16.01.2007, 12:11

wenn ich mich recht erinnere hatte hier ein User mal gepostet was sich im HTML bei google geändert hatte... und dann die regexpr eben entsprechend anpassen

auftragslinker
PostRank 7
PostRank 7
Beiträge: 525
Registriert: 21.04.2005, 14:36

Beitrag von auftragslinker » 16.01.2007, 12:38

mach doch die augen auf:

<h2 class=r><a class=l href="https://hierstehtdieurl" onmousedown="

entspricht also

$suchmuster = "/<a class=l href=\"http:\/\/(.*)\" onmousedown=\"/Uism";
preg_match_all($suchmuster,$seiteninhalt,$urls);
$anzahlgefundenerserps = count($urls[1]);
print_r($urls[1]);

Mark


btw: wann hat sich der denn geändert? habs grad erst selber gesehen...

busTa
PostRank 5
PostRank 5
Beiträge: 312
Registriert: 19.02.2006, 13:36
Wohnort: Hannover

Beitrag von busTa » 16.01.2007, 12:47

War irgendwann Mitte November die Änderung.
Google Ranking überwachen - Bis Platz 1000 - mit History

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag