Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

überprüfung der url die ein bot erhält/erhalten hat

Hier können Sie Ihre Fragen zum Thema Suchmaschinenoptimierung (SEO) / Positionierung stellen
Neues Thema Antworten
redcan
PostRank 4
PostRank 4
Beiträge: 159
Registriert: 25.04.2005, 13:25

Beitrag von redcan » 24.03.2006, 09:18

hallo zuasmmen,

wie oder wo kann ich überprüfen wie ein bot eine seite gespidert hat, mit oder ohne session id.
nachher in den serps ist klar ( :o ) , aber nach direkt dem spidern?

danke vorab!

Anzeige von ABAKUS

von Anzeige von ABAKUS »


Hochwertiger Linkaufbau bei ABAKUS:
  • Google-konformer Linkaufbau
  • nachhaltiges Ranking
  • Linkbuilding Angebote zu fairen Preisen
  • internationale Backlinks
Wir bieten Beratung und Umsetzung.
Jetzt anfragen: 0511 / 300325-0

blinks
PostRank 4
PostRank 4
Beiträge: 155
Registriert: 25.01.2004, 12:37

Beitrag von blinks » 24.03.2006, 09:33

hi,

alle bots können über den HTTP User-Agent identifiziert werden. unter https://www.robotstxt.org/wc/active.html findest du eine ausführliche liste mit infos über einzelne bots. in deinen webserver-logfiles steht zu jedem zugriff der user-agent und die aufgefufene url. du kannst also in deinen logs ganz genau sehen, welcher bot welche seite gespidert hat.

gruß,
blinks

redcan
PostRank 4
PostRank 4
Beiträge: 159
Registriert: 25.04.2005, 13:25

Beitrag von redcan » 24.03.2006, 09:42

danke für die info blinks, aber wo kann ich sehen ob mit oder ohne sessions id gespidert wurde, sollte das in den logs stehen ?

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


blinks
PostRank 4
PostRank 4
Beiträge: 155
Registriert: 25.01.2004, 12:37

Beitrag von blinks » 24.03.2006, 09:52

hmmm,

ich sehe gerade in meinen logs, dass es da auch nicht steht :oops: es gibt aber für den apache eine einstellung, damit das auch geloggt wird. anderenfalls kannst du folgenden codeschnippsel benutzen:

Code: Alles auswählen

<?php
   $host=@gethostbyaddr&#40;$_SERVER&#91;REMOTE_ADDR&#93;&#41;;
   @$logfile=fopen&#40;"geloggt/".date&#40;'dmY'&#41;.".log", "a"&#41;;
   @fwrite&#40;$logfile, mktime&#40;&#41;."|".$host."|".$_SERVER&#91;HTTP_REFERER&#93;." -> ".$_SERVER&#91;REQUEST_URI&#93;."\n"&#41;;
   @fclose&#40;$logfile&#41;;
?>
für den googlebot mit SESSID würde ein eintrag dann so ausschauen:

Code: Alles auswählen

1136073334|crawl-66-249-66-108.googlebot.com| -> /index.html?PHPSESSID=182b61393c145f1b0c60eca6b54c2887
ich hoffe, das hilft dir schonmal weiter. achso, das verzeichnis 'geloggt' muss schreibbar sein!

gruß,
blinks

redcan
PostRank 4
PostRank 4
Beiträge: 159
Registriert: 25.04.2005, 13:25

Beitrag von redcan » 24.03.2006, 10:10

hallo blinks, klappt prima, vielen dank für deine hilfe !!!!!

1143191418|crawl-66-249-66-212.googlebot.com| -> /test/test2/datei.html?sid=996sasdaddd4baddadadae3cc9cd

obwohl im shop sessions abgeschaltet erhält google gerade die sid :evil:
(mozilla/5.0 bot)

blinks
PostRank 4
PostRank 4
Beiträge: 155
Registriert: 25.01.2004, 12:37

Beitrag von blinks » 24.03.2006, 11:12

hi,

freut mich, dass ich dir helfen konnte. wenn der shop auch ohne sessions gespidert werden kann (und davon gehe ich aus, denn für gewöhnlich werden in den sessions lediglich userinfos gespeichert), dann kannst du die zeile in deinem shop, die die session startet, durch die folgende ersetzen:

Code: Alles auswählen

if &#40;!ereg&#40;"googlebot", $host&#41;&#41; session_start&#40;&#41;;
damit wird die session beim googlebot nicht gestartet und folglich keine session-id an die url angehangen. pass damit aber auf und versuche zuerst die logik des shops zu verstehen!! (nicht dass du dir durch meine tipps dein ranking / deinen shop zerschiesst ;) )

gruß,
blinks

redcan
PostRank 4
PostRank 4
Beiträge: 159
Registriert: 25.04.2005, 13:25

Beitrag von redcan » 24.03.2006, 12:10

kann es auch sein, das der geloggte googleeintrag die angefragte url ist, sprich eine die in google bereits mit sid vorhanden war?
habe es mal mit einem simulator versucht, damit bekommt der mozilla/5.0 von google keine sid.

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag