Seite 1 von 1

Google Seite parsen

Verfasst: 16.01.2007, 11:21
von AGB
Hallo,

kann mir jemand sagen, wie ich eine Google Ergebnisseite am besten parsen kann? Ich möchte in den organischen Ergebnissen die Position von bestimmten Domains auslesen. Was ich im Netz gefunden habe, war wohl veraltet und funktioniert nicht mehr.



Disclaimer: Natürlich ist mir klar, dass das gegen die Regeln von Google verstößt, automatische Abfragen nicht über die API durchzuführen. Es geht hier nur um das automatische parsen von manuell abgerufenen und gespeicherten Ergebnisseiten.

Verfasst:
von
SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


Verfasst: 16.01.2007, 11:56
von net(t)worker
schau dir die "veralteten" scripte mal an, an der Technik selber hat sich grundlegend nichts geändert.... aber es hat sich wohl im HTML von Google etwas geändert und so stimmen die regexpr nicht mehr...

Verfasst: 16.01.2007, 12:01
von AGB
Genau das ist ja der Knackpunkt. Nach welchen Mustern soll ich die Seite jetzt parsen und wie sieht der Reguläre Ausdruck dazu aus?

Verfasst: 16.01.2007, 12:11
von net(t)worker
wenn ich mich recht erinnere hatte hier ein User mal gepostet was sich im HTML bei google geändert hatte... und dann die regexpr eben entsprechend anpassen

Verfasst: 16.01.2007, 12:38
von auftragslinker
mach doch die augen auf:

<h2 class=r><a class=l href="https://hierstehtdieurl" onmousedown="

entspricht also

$suchmuster = "/<a class=l href=\"http:\/\/(.*)\" onmousedown=\"/Uism";
preg_match_all($suchmuster,$seiteninhalt,$urls);
$anzahlgefundenerserps = count($urls[1]);
print_r($urls[1]);

Mark


btw: wann hat sich der denn geändert? habs grad erst selber gesehen...

Verfasst: 16.01.2007, 12:47
von busTa
War irgendwann Mitte November die Änderung.