kann mir jemand sagen, wie ich eine Google Ergebnisseite am besten parsen kann? Ich möchte in den organischen Ergebnissen die Position von bestimmten Domains auslesen. Was ich im Netz gefunden habe, war wohl veraltet und funktioniert nicht mehr.
Disclaimer: Natürlich ist mir klar, dass das gegen die Regeln von Google verstößt, automatische Abfragen nicht über die API durchzuführen. Es geht hier nur um das automatische parsen von manuell abgerufenen und gespeicherten Ergebnisseiten.
schau dir die "veralteten" scripte mal an, an der Technik selber hat sich grundlegend nichts geändert.... aber es hat sich wohl im HTML von Google etwas geändert und so stimmen die regexpr nicht mehr...
wenn ich mich recht erinnere hatte hier ein User mal gepostet was sich im HTML bei google geändert hatte... und dann die regexpr eben entsprechend anpassen