Seite 1 von 2

Google meidet optimiertes phpBB

Verfasst: 23.12.2004, 14:59
von Christophe
Hi,

ich habe mein phpBB so optimiert, das Bots eine komplett eigene Version der Seite bekommen, die nur aus dem eigentlichen Inhalt besteht. Damit wird das Forum absolut verdaulich, da weder Navigation noch doppelte Seiten die Bots verwirren. (Beispiel unten) Es werden sogar korrekte Last-Modified-Header gesendet.

MSN hat die Seite so wie sie ist gefressen und liebt sie schon jetzt. Google tut sich mit der Seite leider etwas schwer und es kommen täglich nur ein oder zwei Seiten dazu. Anfang Dezember hat der Bot ungefähr 1.000 Seiten gespidert, die sind aber bis heute nicht im Index aufgetaucht. (Die Seiten sind alle drin, es fehlt Titel und Beschreibung)

Es wird doch nicht an den dynamischen Seiten liegen? Ich habe das Gefühl, dass Google nur Seiten indiziert, die von einer statischen Seite gelinkt ist.

Edit: Der Forum-Index hat PR4, das sollte wohl ausreichen um alles zu indzieren.

Verfasst:
von

Re: Google meidet optimiertes phpBB

Verfasst: 23.12.2004, 15:04
von Moddy
Christophe hat geschrieben:Hi,

ich habe mein phpBB so optimiert, das Bots eine komplett eigene Version der Seite bekommen, die nur aus dem eigentlichen Inhalt besteht. Damit wird das Forum absolut verdaulich, da weder Navigation noch doppelte Seiten die Bots verwirren. (Beispiel unten) Es werden sogar korrekte Last-Modified-Header gesendet.
Nennt man Cloaken und das mag Google überhaupt nicht :wink:

Edit: wenn es denn so einfach wäre, würde es dann nicht jeder machen? :)

Verfasst: 23.12.2004, 15:16
von Christophe
Google ist in der Lage gecloakte Seiten zu entdecken? Das wäre mir neu. Zumindest sind die SERPs voll gecloakter Doorwayseiten. Ich hoffe nicht, dass Google dann ein phpBB abstraft, bei dem geholfen wurde, es voll zu indizieren.

Wenn ich sehe, was hier und drüben alles so rumhängt habe ich das Gefühl, das ist bereits eingetreten.

Verfasst:
von

Verfasst: 23.12.2004, 15:17
von Nikochan
Cloaking Summary:
Page length seen by a normal browser: 78325 bytes.
Page length seen by googlebot: 19964 bytes.
--------------------------------------------------------------------------------
This page cloaks!
Lass dich nicht erwischen...

Gruss,
Nikochan

Verfasst: 23.12.2004, 15:51
von Jojo
Du sagst es, Doorwaypages. Die sind meist ja auch nicht darauf ausgelegt die nächsten 10 Jahre im Index zu verweilen ....

Wie Webby hier doch beweisst kommt man auch ohne Cloaking ganz gut klar. Es ist nur eine Frage der Zeit bis Google dich rausschmeisst. Zumal du auch nur die einfache Variante mit dem User_agent benutzt. Wäre Schade um ein gut besuchtes Forum ...

Verfasst: 23.12.2004, 16:43
von besserwisser
wieso korrekte Last-modified?

ich denke ggle möchte gerne
if-modified-since einträge?

Viele grüße
P.S. das interessiert mich wirklich
(bin ü. Weihnachten nicht zu erreichen, ev. über priv. Nachrichten...)

Verfasst: 23.12.2004, 16:48
von Christophe
Ich benutze die Funktion doConditionalGet, die hier irgendwo im Forum zu finden ist. Natürlich wird auch ein If-Modified-Since entsprechend behandelt.

Verfasst: 14.01.2005, 10:29
von Christophe
So mal ein kleines Update: Da Google anscheinend wirklich Links von dynamischen Seiten nicht weiter verfolgt, habe ich noch zusätzlich eine statische Sitemap gebastelt. Google hat sie auch sofort gefressen, aber mit den ganzen Threads im Forum tut Google sich noch etwas schwer.

Zu meiner Vary: User-Agent-Frage kann ja auch mal jemand was sagen. Ich find' das reichlich merkwürdig.

Verfasst: 14.01.2005, 10:39
von tomaten
besserwisser hat geschrieben:wieso korrekte Last-modified?

ich denke ggle möchte gerne
if-modified-since einträge?

Viele grüße
P.S. das interessiert mich wirklich
(bin ü. Weihnachten nicht zu erreichen, ev. über priv. Nachrichten...)
"if-modified-since" kommt vom Client und wird durch "Last-modified" vom server gesetzt. Beide bilden ein Paar.

Verfasst: 14.01.2005, 11:23
von Webby
Das vernünftig indizieren eine Forum hat viel mehr mit pagerank/linkpopularität zu tun als das link format usw. In deine stelle wird ich eine dynamische sitemap machen wie https://www.abakus-internet-marketing.de/foren/list.php und etwa mod_rewrite nutzen.
User Agent Cloaking für eine php forum ist absolut nicht notwendig und es gibt eine geringer Risiko das die seite autmatisch entdeckt wird und bestraft. Vielleicht nicht heute aber möglicherweise morgen.
Code für das dynamische sitemap kann ich dir schicken. Dein zeit wird besser mit link aufbauen benutzt als cloaking zu betreiben imo aber eine interesannte experiment ist es trozdem :-)

Alan

Verfasst: 14.01.2005, 13:13
von Christophe
Die Domain hat Pr4 (vor dem 1.1. Pr5). Damit sollten alle Themen im Forum Pr1 bekommen. (Was ja bei manchen auch der Fall ist.) Leider sind immer noch nur ca. 176 Seiten indiziert. Mehr sollte bei Pr4 wirklich möglich sein.

Allerdings verstehe ich nicht, was du mit der Sitemap meinst. Ich benutze ein Script und mod_rewrite zum Verstecken der Parameter.

Das mit dem Cloaking ist eine andere Sache, ich bin mir durchaus bewusst, dass das ein Risko ist.

Verfasst: 19.01.2005, 01:33
von Halli
Cloaking Summary:
Page length seen by a normal browser: 78325 bytes.
Page length seen by googlebot: 19964 bytes.
--------------------------------------------------------------------------------
This page cloaks!
Nikochan, welches Tool hast Du für diesen Test benutzt?

Verfasst: 19.01.2005, 02:00
von Moddy
https://www.1-hit.com/all-in-one/php/cloaking-check.php

Have Fun :)

Verfasst: 19.01.2005, 10:35
von Webby
bei Sitemap meine ich eine dynamische neitrag sitemap. Sehe https://www.abakus-internet-marketing.de/foren/list.php

Diese seite hilft sehr um Google meine beiträge zum finden und indizieren.
Alan

Verfasst: 19.01.2005, 15:41
von Christophe
Moddy hat geschrieben:https://www.1-hit.com/all-in-one/php/cloaking-check.php
Was möchtest du jetzt damit sagen?

Edit: Ah, es war eine Antwort.

Du kannst deinen UA auf auf "bot" ändern, dann kannst du die Textversion von meinem Forum browsen.

Das Tool hat übrigens ein Bug: Es verschluckt Slashes am Ende einer URL.

Webby: Über die Sitemap hatten wir schon im anderen Thread gesprochen.