Seite 1 von 1

Phpbb SIDs entfernen / HTTP_USER_AGENT Namen der Spider

Verfasst: 14.09.2004, 05:39
von zoeliakie
Hallo Zusammen,

nachdem mich die Suchen Funktion nicht wirklich weiter gebracht hat, bitte ich Euch um Hilfe. Folgendes: Ich setze ein phpbb Forum ein und habe die unten stehende Änderung in der Session.php eingebaut, damit die Session IDs bei Besuch der Spider nicht mit an die URL drangehängt werden.

Jetzt meine Frage zu den Spidernamen, die ich im Code angeben muß. Insbesondere bei dem für Yahoo. Wass soll ich als HTTP_USER_AGENT angeben?:

Yahoo! Slurp oder nur
Slurp oder
Slurp/2.0

Genauso beim msnbot. Schreibe ich da jetzt nur msnbot oder z.B. msnbot/0.11 (+https://search.msn.com/msnbot.htm)? Ich habe schon so viele Varianten im Netz gefunden und bin mir nicht sicher welche richtig ist.

Über eine Antwort würde ich mich sehr freuen. Vielen Dank.

Gruß, Andreas

Hier der geänderte Code der Session.php:
function append_sid($url, $non_html_amp = false)
{
global $SID, $HTTP_SERVER_VARS;

if ( !empty($SID) && !eregi('sid=', $url) && !strstr($HTTP_SERVER_VARS['HTTP_USER_AGENT'] ,'Googlebot') && !strstr($HTTP_SERVER_VARS['HTTP_USER_AGENT'] ,'slurp@inktomi.com') && !strstr($HTTP_SERVER_VARS['HTTP_USER_AGENT'] ,'Infoseek'))
{
$url .= ( ( strpos($url, '?') != false ) ? ( ( $non_html_amp ) ? '&' : '&' ) : '?' ) . $SID;
}

return $url;
}

Verfasst:
von

Verfasst: 14.09.2004, 11:16
von Lutz-Development
Hi,

mach am besten nur einen Teilstring, also nur slurp, weil das passt ja dann auf Slurp und auf Slurp/2.0 ...

Gruß,
Thomas

Verfasst: 14.09.2004, 16:43
von zoeliakie
Hallo Thomas,

danke für den Tipp. Trotzdem würde ich gerne den Hintergrund verstehen und wissen mit welchen HTTP_USER_AGENT Namen die Bots so unterwegs sind bzw. was alles zum Namen dazuzählt.

Gruß, Andreas