Seite 1 von 1

robots und die ?PHPSESSID & co

Verfasst: 11.09.2011, 17:17
von braintax
Hallo miteinander,
Wie ihr bestimmt wisst akzeptieren bots keine Cookies und daher werden bei mir die Session id´s per URL übergeben falls kein cookie gesetzt werden kann. Was man natürlich deaktivieren könnte, kommt bei mir jedoch eher nicht in frage da die spracheinstellungen und auch sprachdateien durch Session variablen includet werden und ich es gerne so hätte das der google bot jede meiner Seiten des webprojektes in den jeweils verfügbaren sprachen indiziert und die seiten auch texte enthalten sollten. Das umstellen auf subdomains für jede sprache wäre jetzt zu aufwändig, in einem google forum habe ich gelesen das sprachschalter mit sauberen links auch zu guten indizierungen führen. Was bei mir der fall sein sollte.
So, wenn ich jetzt die Einstellungen so lasse wie sie sind, habe ich angst darum das google so was ähnliches wie "https://www.example.com/suche.php?PHPSE ... jnllq7ao71" indiziert und als suchergebnis rausgibt. Es heißt zwar das google selbst dynamische Seiten erkennt und an die URL angehängte Parameter nicht als suchergebniss präsentiert, jedoch lese ich im web immer wieder das genau das passiert ist.
Dann immer mit den Empfehlungen "session.use_trans_sid" zu deaktivieren was aus oben genannten gründen für mich nicht so toll ist.
Irgendwann irgendwo im web hab ich mal gelesen wie man, ich glaub in der robots.txt, deklariert das es sich um dynamische Seiten handelt und die angehängten Parameter nicht als suchergebnis erscheinen sollen.
Weiss jemand genauer wie das ging? ich glaub man schreibt etwas ähnliches wie zB www.example.com/suche.php? in die robots.txt um mitzuteilen das es sich bei der suche.php um eine dynamische seite handelt. Desweiteren kann man glaube ich in den Webmasertools festlegen das die variablen parameter nicht als suchergebniss erscheinen sollten aber ich hätte es gerne zusätzlich in der robots.txt damit auch andere suchmaschinen nicht den fehler machen variablen parameter als suchergebniss zu listen.
Währe echt super wenn wer weiter helfen kann, es geht nur um den syntax der deklaration falls ihn wer kennt bitte posten, thx.

Verfasst:
von

Hochwertiger Linkaufbau bei ABAKUS:
  • Google-konformer Linkaufbau
  • nachhaltiges Ranking
  • Linkbuilding Angebote zu fairen Preisen
  • internationale Backlinks
Wir bieten Beratung und Umsetzung.
Jetzt anfragen: 0511 / 300325-0

Verfasst: 11.09.2011, 17:29
von braintax
User-agent: Googlebot

Allow: /suche.php?

Disallow: /irgendwas

sollte es so gehen? laut goldman.de versteht der google bot ja "Allow"
wie sieht es mit anderen bots aus?

Verfasst: 12.09.2011, 08:03
von dionyseos
Viellciht verstehe ich dich ja falsch, aber bei unserer Prjekte haben wir auch eine Session-ID in der Url stehen. Wir haben das über einen canonical-Tag gelöst:

<link href="https://www.beispiel.de/" rel="canonical" />

Muss halt für jede eindeutige Url, sprich Unterseite angepasstw erden.

Verfasst:
von
SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


Verfasst: 14.09.2011, 00:32
von braintax
Danke für den hinweis mit den rel="canonical". Ich bin mir aber nicht ganz sicher was der bewirkt und ob es ganz meinen erwartungen entsricht.

Ist es nicht so das rel="canonical" einen link "abschwächt"? So das der bot beim folgen des links die sessionid aus der url entfernt und somit einstellungen verloren gehen die er aber unbedingt behalten sollte, weil sonst nur bilder zu sehen sein werden.
sry bin ein noob^^
Was ich brauche formuliere ich mal so einfach wie möglich.

Ich will das der google bot (oder auch alle anderen bots wenn möglich) auf meiner webseite beim "surfen" das MIT der id in der url tun, aber dann beim suchergebniss bei den jeweiligen suchmaschinen die id NICHT in der url steht.
Ist das machbar? sollte doch gehen.

Verfasst: 14.09.2011, 00:43
von 007
Du kannst über die Webmaster-Tools Parameter verwalten, da gibt's sogar eine spezielle Option für Session-Variablen.

Das Canonical-Tag ist dafür nicht gemacht.

Was ich nicht verstehe; Sessions laufen ab, d.h. die (Sprach-) Einstellungen gehen verloren. Woher weiss der Server welche Sprachdatei included werden soll? Ohne Session-Id gleiches Problem.

Verfasst: 14.09.2011, 01:56
von braintax
klar laufen sessions ab ist auch gut so sonst würd der server iwann zusammenbrechen. aber die zeit in der die session läuft, sollte vollkommen ausreichend sein so das der googlebot die seite in jeder sprachversion einmal durchnimmt.
sollte keine sessionvariable gesetzt sein wird eine eine gesetzt, sollten keine header info auslesbar sein wie es beim google bot der fall ist wird die standart sprache als erstes geladen, der bot durchsucht die seite, folgt dem sprachschalter und bekommt eine andere sprache zu sehen durchsucht die seite, usw usw. so hab ich mir das zumindest vorgestellt hoffe es klapt.
Laut google webmaster blog folgt der bot ja auch nem sprachschalter falls der über links als schalter verfügt und so weiter.
stimmt doch soweit oder?

Kann wer gemachte erfahrungen posten?

Verfasst: 14.09.2011, 04:14
von 007
Du hast meine Frage und damit auch das Problem leider nicht verstanden...

Seite auf deutsch: seite.php?sessid=sd5f453sd4f5sd4f5
Seite auf englisch: seite.php?sessid=fd5d4f65sdfdsf24cf

a) Unterschied der beiden Urls? Nur die Session-Id - und die willst Du weglassen (im Sinne von nicht indexieren lassen)?

b) Sessions laufen ab, d.h. wenn der Googlebot die Seite irgendwann wieder abruft, weiss dein Server nicht mehr, welche Sprache damals der indexierten Url samt Session-Id zugeordnet war - und liefert die Standard-Sprache.

c) Gleiches Problem hat auch der User, der bei Google sucht...

Muss ich mehr schreiben?

Verfasst: 14.09.2011, 08:15
von dionyseos
@007:
https://www.canonical-tag.de/
Der canonical-Tag kann durchaus auch dafür genutzt werden, dem Problem mit Session-Ids Herr zu werden...


Allerdings passt die Lösung hier wohl nicht.
Es ist mir auch neu, unterschiedliche Sprachen allein über Session-Ids zu steuern, da gibt es doch weitaus bessere Lösungen.