Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Phpbb SIDs entfernen / HTTP_USER_AGENT Namen der Spider

Alles zum Thema: Robots, Spider, Logfile-Auswertung und Reports
Neues Thema Antworten
zoeliakie
PostRank 1
PostRank 1
Beiträge: 7
Registriert: 06.05.2004, 14:06
Wohnort: Berlin

Beitrag von zoeliakie » 14.09.2004, 05:39

Hallo Zusammen,

nachdem mich die Suchen Funktion nicht wirklich weiter gebracht hat, bitte ich Euch um Hilfe. Folgendes: Ich setze ein phpbb Forum ein und habe die unten stehende Änderung in der Session.php eingebaut, damit die Session IDs bei Besuch der Spider nicht mit an die URL drangehängt werden.

Jetzt meine Frage zu den Spidernamen, die ich im Code angeben muß. Insbesondere bei dem für Yahoo. Wass soll ich als HTTP_USER_AGENT angeben?:

Yahoo! Slurp oder nur
Slurp oder
Slurp/2.0

Genauso beim msnbot. Schreibe ich da jetzt nur msnbot oder z.B. msnbot/0.11 (+https://search.msn.com/msnbot.htm)? Ich habe schon so viele Varianten im Netz gefunden und bin mir nicht sicher welche richtig ist.

Über eine Antwort würde ich mich sehr freuen. Vielen Dank.

Gruß, Andreas

Hier der geänderte Code der Session.php:
function append_sid($url, $non_html_amp = false)
{
global $SID, $HTTP_SERVER_VARS;

if ( !empty($SID) && !eregi('sid=', $url) && !strstr($HTTP_SERVER_VARS['HTTP_USER_AGENT'] ,'Googlebot') && !strstr($HTTP_SERVER_VARS['HTTP_USER_AGENT'] ,'slurp@inktomi.com') && !strstr($HTTP_SERVER_VARS['HTTP_USER_AGENT'] ,'Infoseek'))
{
$url .= ( ( strpos($url, '?') != false ) ? ( ( $non_html_amp ) ? '&' : '&' ) : '?' ) . $SID;
}

return $url;
}

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


Lutz-Development
PostRank 7
PostRank 7
Beiträge: 530
Registriert: 31.05.2004, 09:52

Beitrag von Lutz-Development » 14.09.2004, 11:16

Hi,

mach am besten nur einen Teilstring, also nur slurp, weil das passt ja dann auf Slurp und auf Slurp/2.0 ...

Gruß,
Thomas

zoeliakie
PostRank 1
PostRank 1
Beiträge: 7
Registriert: 06.05.2004, 14:06
Wohnort: Berlin

Beitrag von zoeliakie » 14.09.2004, 16:43

Hallo Thomas,

danke für den Tipp. Trotzdem würde ich gerne den Hintergrund verstehen und wissen mit welchen HTTP_USER_AGENT Namen die Bots so unterwegs sind bzw. was alles zum Namen dazuzählt.

Gruß, Andreas

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag