Seite 1 von 1

RegExp-Frage

Verfasst: 25.07.2005, 13:51
von Nullpointer
hallo,
eigentlich bin ich damit im falschen forum, aber das es um einen speziellen string geht, versuch ich's mal hier im suma-forum:

ich möchte, z.b. mit php, aus meinen server logs a) den google querrystring und b) die herkunft (suche oder adwords) auslesen.

dazu weiß ich, dass a) der querystring im parameter q stackt, und b) dass der referrer für die such google.TLD/search und für das klicken einer anzeige google.TLD/sponsoredlinks lautet (*).

jetzt müsste ich wohl einen regulären ausdruck auf die zeilen anwenden, der 1. zeilen filtert, die von google kommen , dabei die bots außer acht läßt, 2. den querystring ausliest und 3. erkennt ob es search oder sponsoredlinks ist.

vielleicht hat ja schon jemand die passenden codezeilen parat?

ich oute mich bei dieser gelegenheit gleich als regexp-niete.

(*) was bedeutet beim adwords referrer 'hl=de' ?

Verfasst:
von

RegExp-Frage

Verfasst: 25.07.2005, 15:51
von derHund
nur mal auf die schnelle:

Code: Alles auswählen

#^http://(?>www\.)?google\.([^/]+)/.*[?&]q=([^&]+)#is
im ersten unterausdruck findest du die tld, im zweiten den suchbegriff, der aber noch bearbeitet werden muß.

das ist nur der regexp ansich, muß halt in dein preg_match einbauen ...

3. kann ich dir jetzt spontan nicht beantworten, wenn du aber mal einen beispiel-referer postest, ... wenn sonst wie irgendetwas nicht passen sollte, poste bitte auch den entsprechenden referer.

RegExp-Frage

Verfasst: 25.07.2005, 19:24
von Nullpointer
danke, werde ich mal ausprobieren.
beim referrer von adwords steht nach google.de/sponsoredlinks statt google.de/search.