Seite 1 von 1

Spider war da - dokumentieren in tracker.php

Verfasst: 12.02.2004, 09:04
von Klaus
Hallo.
Von bugscout habe ich folgendes gefunden:
(Danke an dieser Stelle)

Code: Alles auswählen

<? 
include&#40;$DOCUMENT_ROOT.'/tracker.php'&#41;; 
?>
diese 3 zeilen kommt in den body der seite, die kontrolliert werden soll.

Code: Alles auswählen

<? 
$trackurl = $_SERVER&#91;'PHP_SELF'&#93; ; 
if &#40;$_SERVER&#91;'QUERY_STRING'&#93;!=''&#41; &#123;$trackurl="$trackurl?".$_SERVER&#91;'QUERY_STRING'&#93;;&#125; 

$trackUserAgent =strtolower&#40;$_SERVER&#91;'HTTP_USER_AGENT'&#93;&#41;; 
if &#40;stristr&#40;$trackUserAgent ,"archiver"&#41;&#41; &#123;$trackrobot="Alexa";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"exabot"&#41;&#41; &#123;$trackrobot="Exalead";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"fast"&#41;&#41; &#123;$trackrobot="Fast";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"firefly"&#41;&#41; &#123;$trackrobot="Fireball";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"googlebot"&#41;&#41; &#123;$trackrobot="Google";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"grub"&#41;&#41; &#123;$trackrobot="Looksmart";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"mirago"&#41;&#41; &#123;$trackrobot="Mirago";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"msnbot"&#41;&#41; &#123;$trackrobot="MSN";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"nutch"&#41;&#41; &#123;$trackrobot="Nutch";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"slurp"&#41;&#41; &#123;$trackrobot="Inktomi";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"scooter"&#41;&#41; &#123;$trackrobot="Altavista";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"teoma"&#41;&#41; &#123;$trackrobot="Ask Jeeves - Teoma";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"voilabot"&#41;&#41; &#123;$trackrobot="Voila";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"zyborg"&#41;&#41; &#123;$trackrobot="Wisenut";&#125; 

if &#40;$trackrobot != ""&#41; 
&#123; 
$trackdate = date&#40;'Y-m-d H&#58;i&#58;s'&#41;; 
$trackhost = $_SERVER&#91;'HTTP_HOST'&#93;; 
$trackaddr = $_SERVER&#91;'REMOTE_ADDR'&#93;; 
$trackbody = " ".$trackrobot." hat am ".$trackdate."\n folgende URL besucht ".$trackhost.$trackurl."\n\n remote_adress = ".$trackaddr; 

mail&#40;'email@deinedomain.tld',$trackrobot.' - '.$trackdate,$trackbody&#41;; 

&#125; 

?>
diese zeilen kommen in eine datei, die dann als tracker.php abgespeichert wird. sie schickt dir dann ne mail, wenn einer dieser spider da war. email@deinedomain.tld nicht vergessen

aber nicht in alle dateien einbauen, sonst ist die mailbox voll.
Meine Frage zum Einbau:
Dieser Code kommt z.B. in die Startseite?
include($DOCUMENT_ROOT.'/tracker.php');

Und in welchem Verzeichnis muss dann die tracker.php liegen?
Im selbigen?
oder muss es ->include($DOCUMENT_ROOT.'tracker.php'); heißen?
(Ohne slash?)

Danke und Gruß
Klaus

Verfasst:
von
SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


Verfasst: 12.02.2004, 11:28
von bugscout
moin klaus,

die tracker.php liegt im hauptverzeichnis, da wo auch robots.txt und index... liegen.

grüsse

Verfasst: 13.02.2004, 17:27
von Klaus
Hei bugscout.
Hatte es auf einer der unteren Seite eingebaut.
Klappt einwandfrei, mail-nachricht erhalten.

Jetzt noch in einen Datenbak schreiben und es ist gut. Obwohl... ich habe jetzt ja php-code in eine html-Datei geschrieben. Durch eine .htaccess wird es geparst.

Der Header (wie hier schon beschrieben) kann oder muss dann noch bearbeitet werden? Weil ich mir sonst für das spidern für diese kleine "Spielerei" nichts gutes tue?

Danke und Gruß
Klaus

Verfasst: 17.02.2004, 09:49
von Klaus
Hallo. Noch eine Frage:

Ist das richtig oder muss es mailto heißen?

Ich bekomme zwar die mails, sie landen jedoch bei der Kundenmail meines Providers (an die gehen alle mails, die nicht eindeutig zuzuweisen sind)

Code: Alles auswählen

mail&#40;'name@domain.de',$trackrobot.' - '.$trackdate,$trackbody&#41;; 
Danke und Gruß
Klaus

Verfasst: 17.02.2004, 10:02
von bugscout
moin klaus

'name@domain.de' da muss natürlich deine emailadresse rein

grüsse

Verfasst: 17.02.2004, 10:12
von Klaus
Mopin bugscout.
Ja, das ist mir klar.
:wink:
Aber bei name habe ich meine eindeutige e-mail-addi und trotzdem geht sie an einen eingerichteten forwarder (eben der Eintrag bei meinem Stammdaten beim Provider) und nicht an die name-mail.
Klaus

Verfasst: 17.02.2004, 10:25
von bugscout
moin moin,

kannst du mir mail den mail-header zukommen lassen
per pn?

grüsse

Verfasst: 11.03.2004, 21:37
von inso
hat das vielleicht schon jemand mit DB anbindung fertig und ist so nett es hier zur verfügung zu stellen?

mfg
inso

Verfasst: 11.03.2004, 22:13
von bugscout
moin inso,

wenn das mit datenbank laufen soll, nimm
doch einfach https://www.robotstats.com/

grüsse

Verfasst: 11.03.2004, 23:53
von inso
danke sieht ganz gut aus ...
werde es morgen mal testen.

inso

Verfasst: 14.03.2004, 12:33
von Hulot
Hallo!
Mittlerweile gibt es als Perlscript namens Sumalogger, dass die Bots in einer monatlichen Liste aufführt und bei Bedarf auch via eMail mitteilt, wann wer wo da war. Sumalogger ist allerdings ein Modul für ein Multiadmin-Script. Vielleicht besteht ja Interesse an diesem (kostenlosen) Script.

Gruß Hulot

Verfasst: 02.04.2004, 13:06
von Klaus
Moin.
Wie binde ich denn in die tracker.php den neuen bot von yahoo ein?

Code: Alles auswählen

&#40;compatible; Yahoo! Slurp; http&#58;//help.yahoo.com/help/us/ysearch/slurp&#41;
so erscheint er ja in den Log-Files.

Code: Alles auswählen

if &#40;stristr&#40;$trackUserAgent ,"Yahoo! Slurp"&#41;&#41; &#123;$trackrobot="Yahoo";&#125; 
so richtig?
----------------------------------------------------
Nachtrag:
yep.
So geht es. Der Yahoo-Bot war eben da.
----------------------------------------------------
Gruß
Klaus

Verfasst: 19.07.2004, 15:35
von Klaus
Hallo.
Voher war die URL googlebot.com/bot.html
Muss die tracker.php jetzt angepasst werden?
https://www.abakus-internet-marketing.d ... 8318#48318
Gruß
Klaus