Seite 1 von 1

"Auszeit" für die IP - Google Status

Verfasst: 04.09.2013, 08:39
von RW
Hi,

Bin dabei mal wieder einen kleine Sache zu bauen und brauche mal Hilfe.

Google gibt bei zu vielen automatisierten Anfragen eine "Auszeit" für die IP
habe schon versucht die ganze Sache zu simulieren .. leider ohne gewünschtes Ergebnis.


a.) gibt es irgendwo eine Übersicht über mögliche Google Ausgabeseiten die angezeigt werden wenn zuviel im Index gekramt wird ?
möglichst "regex Muster zum implementieren" :sol:


b.) wird ein Status mitgeliefert ;o)

403 oder so... will diesen http-Status abfangen und ggf. den Router ansteuern (neue Einwahl = neue IP)



Code: Alles auswählen

function extract_status($response)
    {
        @preg_match("|^HTTP/[\d\.x]+ (\d+)|", $response, $m);

        if (isset($m[1])) {
            return (int) $m[1];
        } else {
            return false;
        }
    }
Und....
Ja, ist für die ScrapeBox ;o) will mir die Proxy suche sparen ....
lasse ein kleines Skript im Hintergrund laufen welches regelmäßig nachschaut ob meine IP schon verbrand ist 8)

Verfasst:
von

OK ich hab's = 302

Verfasst: 04.09.2013, 09:30
von RW
Kann ja sein das einer braucht ;o)

Code: Alles auswählen

------------------------------------------------------------
HTTP/1.0 302 Found
Cache-Control: private
Content-Type: text/html; charset=UTF-8
Location: http://www.google.com/sorry/?continue=http://www.google.de/search%3Fq%
3D(SEO)%26num%3D100%26hl%3Dde%26lr%3D%26c2coff%3D1%26start%3D1%26sa%3DN
Content-Length: 338
Date: Wed, 04 Sep 2013 08:25:05 GMT
Server: GFE/2.0
Alternate-Protocol: 80:quic

<HTML><HEAD><meta http-equiv="content-type" content="text/html;charset=utf-8">
<TITLE>302 Moved</TITLE></HEAD><BODY>
<H1>302 Moved</H1>
The document has moved
<A HREF="http&#58;//www.google.com/sorry/?continue=http&#58;//www.google.de/search%3Fq%3
D&#40;SEO&#41;%26num%3D100%26hl%3Dde%26lr%3D%26c2coff%3D1%26start%3D1%26sa%3DN">here</A>
.
</BODY></HTML>