Seite 1 von 1

Tool, regelmäßig prüfen, URL in den SERPs?

Verfasst: 14.07.2007, 15:42
von fi-ausbilden
Hi!

Ich suche ein Tool, mit dem man regelmäßig (per CRON?) prüfen kann, ob eine bestimmte URL in den SERPs vorhanden ist.

Ich stelle mir das so vor, dass ich URLs eingeben kann und das Tool regelmäßig prüft, ob die URL gefunden wird.

Kennt jemand von Euch sowas?

Verfasst:
von

Verfasst: 15.07.2007, 12:50
von Datibesol
Ich hab dir mal schnell so ein ähnliches Tool geschrieben.
Nimm das folgende PHP-Skript:

Code: Alles auswählen

<?php

$url = 'http&#58;//www.google.de/search?btnG=Suche&meta=&hl=de&q=cache%3A'.urlencode&#40;$_SERVER&#91;'argv'&#93;&#91;1&#93;&#41;;
$google_antwort = file_get_contents&#40;$url&#41;;

if &#40;strlen&#40;$google_antwort&#41; == 0&#41; 
  die&#40;"Fehler beim Aufruf von Google.de - bitte probieren Sie es spaeter noch einmal.\n"&#41;;

if &#40; strpos&#40;$google_antwort, 'Es wurden keine'&#41; === FALSE&#41;
  print "Die Url ".$_SERVER&#91;'argv'&#93;&#91;1&#93;." befindet sich im Google-Cache\n";

else
  print "Die Url ".$_SERVER&#91;'argv'&#93;&#91;1&#93;." befindet sich NICHT im Google-Cache\n";
?>
Lege es irgendwo auf dem Server ab (z.B. unter "/verzeichnis/ist_gecached.php").
Als Cronjob kannst du dann eintragen:

/pfadzuphp/php /verzeichnis/ist_gecached.php https://www.url.xy
(anderes Beispiel: /sbin/php /etc/cron-skripte/ist_gecached.php https://www.url.xy )

Ist dein Server so konfiguriert, dass die Ergebnisse von Cronjobs automatisch an dich gemailt werden? Wenn nicht, dann ersetze die print-Anweisungen im Quellcode einfach durch mail()-Funktionen.

Das Skript überprüft genaugenomen, ob sich die URL im Google-Cache befindet.
Falls du auch URLs überprüfen möchtest, die das Cachen verboten haben (über "noarchive"), dann könntest du evtl. im Quelltext "q=cache" durch "q=allinurl" ersetzen - das dürfte dann allerdings manchmal nicht funktionieren, da dann Satzzeichen u.ä. innerhalb der URL von Google ignoriert werden.

Verfasst: 15.07.2007, 13:16
von fi-ausbilden
Klasse! Vielen lieben Dank!

Verfasst:
von

Verfasst: 15.07.2007, 13:52
von Datibesol
Bitte. Ich hab noch per "Edit" schnell einen kleinen Fehler korrigiert:
Wenn man den Cronjob einträgt, lautet die Pfadangabe nicht:
/verzeichnis/ist_gecached.php https://www.url.xy

sondern:
/pfadzuphp/php /verzeichnis/ist_gecached.php https://www.url.xy

Also angenommen, der PHP-Interpreter liegt unter "/sbin/php" und das Skript unter "/etc/cron-skripte/ist_gecached.php", und der Check sollte jeden Morgen um 5h ausgeführt werden, dann könnte man mit einem Aufruf von "crontab -e" das so als Cronjob eintragen:

00 05 * * * /sbin/php /etc/cron-skripte/ist_gecached.php https://www.url.xy

Verfasst: 15.07.2007, 13:58
von fi-ausbilden
Jo, vielen Dank! Das mit Cron bekomme ich hin :-)

Ich werde das Skript etwas "pimpen", um z.B. die URLs aus der DB auszulesen und die Werte, wann eine Seite gefunden wurde einzutragen... (irgendwie so...)

Wenn das Skript fertig ist, werd ich es wieder veröffentlichen..

Verfasst: 16.07.2007, 08:57
von Datibesol
Ok :)

Verfasst: 18.07.2007, 12:48
von Max AT
wir haben ein webtool programmiert, wo man zuerst alles in der datenbank hinterlegt - mögliche suchmaschinen, dann kunde mit keywords, bzw kombis, wichtigkeit der site, url, etc und dieser checkt alle stunden/tage (je nach wichtigkeit, kann man definieren) die serps ..

wir verwenden das zur kontrolle der adwords schaltungen, um nicht von der google ausgabe abhängig zu sein.

ist fein wenn man hunderte domains zum checken hat .. für einige wenige ist der cron mit dem script sicher auch gut brauchbar.