Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Spider war da - dokumentieren in tracker.php

Alles zum Thema: Robots, Spider, Logfile-Auswertung und Reports
Neues Thema Antworten
Klaus
PostRank 7
PostRank 7
Beiträge: 595
Registriert: 05.08.2003, 08:21
Wohnort: Darmstadt

Beitrag von Klaus » 12.02.2004, 09:04

Hallo.
Von bugscout habe ich folgendes gefunden:
(Danke an dieser Stelle)

Code: Alles auswählen

<? 
include&#40;$DOCUMENT_ROOT.'/tracker.php'&#41;; 
?>
diese 3 zeilen kommt in den body der seite, die kontrolliert werden soll.

Code: Alles auswählen

<? 
$trackurl = $_SERVER&#91;'PHP_SELF'&#93; ; 
if &#40;$_SERVER&#91;'QUERY_STRING'&#93;!=''&#41; &#123;$trackurl="$trackurl?".$_SERVER&#91;'QUERY_STRING'&#93;;&#125; 

$trackUserAgent =strtolower&#40;$_SERVER&#91;'HTTP_USER_AGENT'&#93;&#41;; 
if &#40;stristr&#40;$trackUserAgent ,"archiver"&#41;&#41; &#123;$trackrobot="Alexa";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"exabot"&#41;&#41; &#123;$trackrobot="Exalead";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"fast"&#41;&#41; &#123;$trackrobot="Fast";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"firefly"&#41;&#41; &#123;$trackrobot="Fireball";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"googlebot"&#41;&#41; &#123;$trackrobot="Google";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"grub"&#41;&#41; &#123;$trackrobot="Looksmart";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"mirago"&#41;&#41; &#123;$trackrobot="Mirago";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"msnbot"&#41;&#41; &#123;$trackrobot="MSN";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"nutch"&#41;&#41; &#123;$trackrobot="Nutch";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"slurp"&#41;&#41; &#123;$trackrobot="Inktomi";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"scooter"&#41;&#41; &#123;$trackrobot="Altavista";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"teoma"&#41;&#41; &#123;$trackrobot="Ask Jeeves - Teoma";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"voilabot"&#41;&#41; &#123;$trackrobot="Voila";&#125; 
if &#40;stristr&#40;$trackUserAgent ,"zyborg"&#41;&#41; &#123;$trackrobot="Wisenut";&#125; 

if &#40;$trackrobot != ""&#41; 
&#123; 
$trackdate = date&#40;'Y-m-d H&#58;i&#58;s'&#41;; 
$trackhost = $_SERVER&#91;'HTTP_HOST'&#93;; 
$trackaddr = $_SERVER&#91;'REMOTE_ADDR'&#93;; 
$trackbody = " ".$trackrobot." hat am ".$trackdate."\n folgende URL besucht ".$trackhost.$trackurl."\n\n remote_adress = ".$trackaddr; 

mail&#40;'email@deinedomain.tld',$trackrobot.' - '.$trackdate,$trackbody&#41;; 

&#125; 

?>
diese zeilen kommen in eine datei, die dann als tracker.php abgespeichert wird. sie schickt dir dann ne mail, wenn einer dieser spider da war. email@deinedomain.tld nicht vergessen

aber nicht in alle dateien einbauen, sonst ist die mailbox voll.
Meine Frage zum Einbau:
Dieser Code kommt z.B. in die Startseite?
include($DOCUMENT_ROOT.'/tracker.php');

Und in welchem Verzeichnis muss dann die tracker.php liegen?
Im selbigen?
oder muss es ->include($DOCUMENT_ROOT.'tracker.php'); heißen?
(Ohne slash?)

Danke und Gruß
Klaus

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


bugscout
PostRank 9
PostRank 9
Beiträge: 2602
Registriert: 23.06.2003, 12:24

Beitrag von bugscout » 12.02.2004, 11:28

moin klaus,

die tracker.php liegt im hauptverzeichnis, da wo auch robots.txt und index... liegen.

grüsse

Klaus
PostRank 7
PostRank 7
Beiträge: 595
Registriert: 05.08.2003, 08:21
Wohnort: Darmstadt

Beitrag von Klaus » 13.02.2004, 17:27

Hei bugscout.
Hatte es auf einer der unteren Seite eingebaut.
Klappt einwandfrei, mail-nachricht erhalten.

Jetzt noch in einen Datenbak schreiben und es ist gut. Obwohl... ich habe jetzt ja php-code in eine html-Datei geschrieben. Durch eine .htaccess wird es geparst.

Der Header (wie hier schon beschrieben) kann oder muss dann noch bearbeitet werden? Weil ich mir sonst für das spidern für diese kleine "Spielerei" nichts gutes tue?

Danke und Gruß
Klaus

Klaus
PostRank 7
PostRank 7
Beiträge: 595
Registriert: 05.08.2003, 08:21
Wohnort: Darmstadt

Beitrag von Klaus » 17.02.2004, 09:49

Hallo. Noch eine Frage:

Ist das richtig oder muss es mailto heißen?

Ich bekomme zwar die mails, sie landen jedoch bei der Kundenmail meines Providers (an die gehen alle mails, die nicht eindeutig zuzuweisen sind)

Code: Alles auswählen

mail&#40;'name@domain.de',$trackrobot.' - '.$trackdate,$trackbody&#41;; 
Danke und Gruß
Klaus

bugscout
PostRank 9
PostRank 9
Beiträge: 2602
Registriert: 23.06.2003, 12:24

Beitrag von bugscout » 17.02.2004, 10:02

moin klaus

'name@domain.de' da muss natürlich deine emailadresse rein

grüsse

Klaus
PostRank 7
PostRank 7
Beiträge: 595
Registriert: 05.08.2003, 08:21
Wohnort: Darmstadt

Beitrag von Klaus » 17.02.2004, 10:12

Mopin bugscout.
Ja, das ist mir klar.
:wink:
Aber bei name habe ich meine eindeutige e-mail-addi und trotzdem geht sie an einen eingerichteten forwarder (eben der Eintrag bei meinem Stammdaten beim Provider) und nicht an die name-mail.
Klaus

bugscout
PostRank 9
PostRank 9
Beiträge: 2602
Registriert: 23.06.2003, 12:24

Beitrag von bugscout » 17.02.2004, 10:25

moin moin,

kannst du mir mail den mail-header zukommen lassen
per pn?

grüsse

inso
PostRank 4
PostRank 4
Beiträge: 114
Registriert: 15.02.2004, 14:54
Wohnort: Furtwangen

Beitrag von inso » 11.03.2004, 21:37

hat das vielleicht schon jemand mit DB anbindung fertig und ist so nett es hier zur verfügung zu stellen?

mfg
inso

bugscout
PostRank 9
PostRank 9
Beiträge: 2602
Registriert: 23.06.2003, 12:24

Beitrag von bugscout » 11.03.2004, 22:13

moin inso,

wenn das mit datenbank laufen soll, nimm
doch einfach https://www.robotstats.com/

grüsse

inso
PostRank 4
PostRank 4
Beiträge: 114
Registriert: 15.02.2004, 14:54
Wohnort: Furtwangen

Beitrag von inso » 11.03.2004, 23:53

danke sieht ganz gut aus ...
werde es morgen mal testen.

inso

Hulot
PostRank 2
PostRank 2
Beiträge: 55
Registriert: 07.03.2004, 02:43

Beitrag von Hulot » 14.03.2004, 12:33

Hallo!
Mittlerweile gibt es als Perlscript namens Sumalogger, dass die Bots in einer monatlichen Liste aufführt und bei Bedarf auch via eMail mitteilt, wann wer wo da war. Sumalogger ist allerdings ein Modul für ein Multiadmin-Script. Vielleicht besteht ja Interesse an diesem (kostenlosen) Script.

Gruß Hulot

Klaus
PostRank 7
PostRank 7
Beiträge: 595
Registriert: 05.08.2003, 08:21
Wohnort: Darmstadt

Beitrag von Klaus » 02.04.2004, 13:06

Moin.
Wie binde ich denn in die tracker.php den neuen bot von yahoo ein?

Code: Alles auswählen

&#40;compatible; Yahoo! Slurp; http&#58;//help.yahoo.com/help/us/ysearch/slurp&#41;
so erscheint er ja in den Log-Files.

Code: Alles auswählen

if &#40;stristr&#40;$trackUserAgent ,"Yahoo! Slurp"&#41;&#41; &#123;$trackrobot="Yahoo";&#125; 
so richtig?
----------------------------------------------------
Nachtrag:
yep.
So geht es. Der Yahoo-Bot war eben da.
----------------------------------------------------
Gruß
Klaus

Klaus
PostRank 7
PostRank 7
Beiträge: 595
Registriert: 05.08.2003, 08:21
Wohnort: Darmstadt

Beitrag von Klaus » 19.07.2004, 15:35

Hallo.
Voher war die URL googlebot.com/bot.html
Muss die tracker.php jetzt angepasst werden?
https://www.abakus-internet-marketing.d ... 8318#48318
Gruß
Klaus

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag