Seite 1 von 1

Googlebot neue Kennung? - DRINGEND

Verfasst: 23.04.2009, 07:44
von stevenk
Hi Leute

Ist jemandem bekannt ob Google eine neue Crawlerkennung verwendet? Der Hintergrund ist folgender: Auf einer meiner Seiten verwende ich einen Warenkorb der mit Sessions arbeitet. Um DC zu vermeiden, frage ich vorm Zugriff der Seite den User_Agent ab. Ist es ein "Mensch" startet die Session, andernsfalls, sprich wenn Google kommt natürlich nicht.

Das funktionierte bisher auch problemlos, heute sah ich jedoch das erste Seiten in Index zu finden sind die eine Session-ID in der URL haben.

Die Frage ist daher ob es irgendwelche Infos gibt ob Google eventuell die Crawlerkennung geändert hat??

Danke für jede Info ...

Verfasst:
von

Verfasst: 23.04.2009, 07:59
von Wirths Media
Nein. Wie ist denn die IP?

Verfasst: 23.04.2009, 08:31
von seomedius
Es beseht auch die Möglichkeit das jemand seinen Warenkorb verlinkt hat oder dein preg_match stimmt nicht.

Wie ist denn dein regulärer Ausdruck um den Bot zu bestimmen?

Verfasst:
von
SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


Verfasst: 23.04.2009, 08:58
von marc75
Problem wird sein, das du nur schaust ob ein Mensch da ist und startest gleich die Session. Der "Mensch" kopiert dann mal ein Link samt Session und postet diesen in ein Forum und schon kommen die Sumas an solche Sessionlinks.

Die Session nur nach dem Ablegen eines Artikel in den WK starten oder beim Login (den WK nur über form Button befüllen lassen). Dann immer prüfen ob ein Session Cookie möglich und in diesem Fall die Sessions aus den Urls entfernen.
Und dann ruhig auch die Urls bei jedem Seitenaufruf prüfen, ob auch kein Schnössel irgendwelche Zeichen mit angehangen hat und wenn doch dann per 301 auf die richtige Url umleiten. usw.

Verfasst: 23.04.2009, 10:08
von Mork vom Ork
marc75 hat geschrieben:Dann immer prüfen ob ein Cookie möglich und in diesem Fall die Sessions aus den Urls entfernen.
Am Besten gar nicht erst mit dem Unsinn anfangen, die URL mit Session-Daten zu belästigen, das ist vollkommen unnötig und bringt -wie hier zu sehen- um ein Vielfaches mehr Ärger als Umsatz.

Praktisch niemand hat Cookies deaktiviert. Denn was gerne vergessen wird: Auch das halbe Promille Besucher, das Cookies grundsätzlich verweigert, weiß, was es tut, und kann bei Bedarf Cookies zulassen.
Und wer auf den Umsatz des Promilles von diesem halben Promille, das zu bequem ist, Cookies für den Einkauf kurz einzuschalten, nicht verzichten kann, hat ganz andere Probleme mit seinem Laden …

Verfasst: 23.04.2009, 10:09
von net(t)worker
Naja... neu ist es nicht, aber es kommt zwischendurch immer mal wieder vor das der Googlebot sich als normaler browser ausgibt... zudem gibt es diverse Googlebots die unterwegs sind...

Verfasst: 23.04.2009, 14:20
von stevenk
@seomedius
Bisher genügte eine Abfrage nach dem Motto
---- stristr($_SERVER['http_user_agent'],'google') ------

um das zu bereinigen. Dieses Script (Kurzform) ist auf jeder Seite weshalb auch Links von aussen nicht möglich sein dürften, also keine ID erzeugen ...

@marc75
Das mit der SessionID posten wäre zwar eine Möglichkeit, da die sessions aber auch nur gestartet wird wenn der User keine Cookies akzeptiert, äußerst unwahrscheinlich :-?

@mork
Danke für den Hinweis, aber ich möchte den korrekt funktionierenden Warenkorb nicht davon abhängig machen ob der User den Browser richtig konfiguriert hat auch wenn dies natürlich meistens der Fall ist. :)

Verfasst: 23.04.2009, 15:20
von marc75
Mork vom Ork hat geschrieben: Praktisch niemand hat Cookies deaktiviert. Denn was gerne vergessen wird: Auch das halbe Promille Besucher, das Cookies grundsätzlich verweigert, weiß, was es tut, und kann bei Bedarf Cookies zulassen.
Und wer auf den Umsatz des Promilles von diesem halben Promille, das zu bequem ist, Cookies für den Einkauf kurz einzuschalten, nicht verzichten kann, hat ganz andere Probleme mit seinem Laden …
Du bist keine Shopbetreiber oder? Denn dann wüsstest du, wie viele User nicht wissen, was sie aktiviert und deaktiviert an Ihren Rechnersystem haben. Wenn der Kunde/User dann auch noch nicht mal den Hinweis bekommt das Cookies (oft nicht wissen was das ist) benötigt werden, erhält man in regelmäßigen Abstand Emails und Anrufe mit dem Hinweis das der Shop nicht funktioniert etc.

Und auf Entwicklerseite muß ich sagen, ein guter Entwickler durchdenkt alle Möglichkeiten und Wege, seine Software beim Benutzen für den Anwender lauffähig zu halten. Und da gehört auch das deaktivierte Cookie dazu, genauso auch wenn ein User JS deaktiviert hat. etc.



@stevenk
Das mit der SessionID posten wäre zwar eine Möglichkeit, da die sessions aber auch nur gestartet wird wenn der User keine Cookies akzeptiert, äußerst unwahrscheinlich
Naja, meine Erfahrung damit sagt mir das Gegenteil ist der Fall. Hab früher öfters die Links samt Session in verschiedenen Foren wiedergefunden.

Code: Alles auswählen

stristr($_SERVER['http_user_agent'],'google')
Naja, man kann sich nie 100% Sicher sein, das Google seine UA mit sendet. Ebenfalls besteht ja die Möglichkeit, das andere Bots deine Seiten abgrassen, aufbereiten und für MFA Seiten wieder ausspucken. Und Google findet spätestens dann die Sessions.

Verfasst: 23.04.2009, 15:37
von luzie
Warum die Verrenkungen? Schliesse URLs mit Session-IDs aus:

https://www.google.com/support/webmaste ... swer=40367

Verfasst: 23.04.2009, 15:40
von luzie
Und/Oder bau link-rel-canonical ein:

https://www.google.com/support/webmaste ... wer=139394

Verfasst: 23.04.2009, 15:58
von stevenk
Hi Luzie

Guter Lösungsansatz, das werde ich mal testen ...

cu