Seite 1 von 2

# und & im Dateinamen

Verfasst: 11.06.2004, 08:03
von Wuppi
Hi

hoffe ich bin hier halbwegs richtig ;)

Hab mein Forum mit "Short-URLs" ausgestatt (statt viewtopic.php?t=123, halt ftopic123.html ... ähnlich wie hier im Forum). Jetzt hab ich die Highlight-Funktion endlich sauber integriert. (viewtopic.php?t=123&hightlight=test) Der Dateiname sieht jetzt so aus: ftopic123.html&highlight=test ....

Und hier jetzt die Frage ... wie interpretiert Google sowas?

ftopic123.html&highlight=test ist die gleiche Seite wie ftopic123.html
oder sinds 2 "unterschiedliche" Seiten??

Soeben kam mir daher der Gedanke, das & durch ein # Auszutauschen. Hinter .html kommt es ja öfters mal vor das dort ein # steht (gehört eher dahin also ein &) ... also Sprungmarke innerhalb einer Datei. Google würde das # also eher als Navigationshilfe verstehen, und daher doch annehmen das ftopic123.html#highlight=test und ftopic123.html ein und die selbe Seite ist!?? Oder???

Ich möchte halt vermeiden das Seiten mit gleichen Content unter div. Dateinamen im Google-Index auftauchen.

Bis denne
Wuppi

Verfasst:
von

Verfasst: 11.06.2004, 09:51
von Wuppi
Hi

:( Mist ... # darf ich nicht in den Dateinamen packen - das Highlight wird dann nicht ausgeführt :(

Gibt es ein anderes Zeichen, womit ich bezwecken könnte, das google ein und die selbe Seite nicht 2mal spidert? Also ftopic123.html[]highlight=test das gleiche ist wie ftopic123.html ....

Könnte das ganze wohl auch via robots.txt ausschließen ... aber ich bezwecke damit das google sich die Profile anschaut, dann auf "alle Beiträge dieses Users anzeigen" geht und sich dann hier bedienen kann - so bekommt er vielleicht den ein oder anderen neuen Thread ;)

Bis denne
Wuppi

Verfasst: 11.06.2004, 11:32
von Southmedia
Beib das geht nicht.

Alles was du als Parameter hinten dran hängst ist für Google eine neue Seite (? und &). Dass # ist nur für Anker und da eben nur für den Browser, das wird gar nicht an den Server übermittelt.

Verfasst:
von

Verfasst: 11.06.2004, 13:13
von Wuppi
Hi

ja richtig - bei # springt er an die stelle die dafür vorgesehen ist (der Browser) ;) ... daher versteh ich eigentlich nicht, wieso ich mit # kein Highlight mehr habe ... Markiert (Highlight) wird doch vom Server - da sollte es also wenns beim Browers ankommt, immer noch markiert sein ... aber scheinbar ignoriert der Server das # so das er denkt das danach so ne spungmarke kommt und daher wird wohl das highlight=test total ignoriert - obwohl in der .htaccess angeben wurde, das er das abarbeiten soll :( mist

Da muß ich dann wohl in die phpbb2-Grundtiefen rein ;) ... und dafür sorgen das highlight an ner URL nur dann gehangen wird, wenns auch ein Highlight gibt (Profil -> "Alle Beiträge von User anzeigen" -> überall unnötigerweise Highlights - diese Seiten wären aber für google garnicht mal so schlecht zum crawlen ....)

Wie geht Google den um wenn er ein und denselben Inhalt in "2" - "3" Dateien findet ??

Bis denne
Wuppi

Verfasst: 11.06.2004, 14:04
von manute
versteh ich eigentlich nicht, wieso ich mit # kein Highlight mehr habe
weil jan sich vertippt hat. :D er meinte, das #, und was dahinter steht, wird gar nicht an den server übermittelt, da es nur für den browser relevant ist.
deswegen kann das phpbb-script es auch nicht auslesen und nicht highlighten, logisch oder?

Verfasst: 11.06.2004, 15:27
von ollipop
Southmedia hat geschrieben:Alles was du als Parameter hinten dran hängst ist für Google eine neue Seite (? und &). Dass # ist nur für Anker und da eben nur für den Browser, das wird gar nicht an den Server übermittelt.
Ist das eigentlich schlimm, wenn man dann URLs im Index stehen hat, bei denen noch ein "?"-Parameter dranhängt? (Also zwei unterschiedliche URLs mit exaktem Inhalt)

Wenn ich intern auf der Seite ohne "?" linke und alle anderen mit "?" auf mich linken - bekommt diese Seite einen PR "vererbt"?

Verfasst: 11.06.2004, 16:09
von manute
Wenn ich intern auf der Seite ohne "?" linke und alle anderen mit "?" auf mich linken - bekommt diese Seite einen PR "vererbt"?
google wird, wenn der content wirklich exakt gleich ist, nur eine von beiden im index behalten. kein index, kein pr.

Verfasst: 11.06.2004, 16:46
von Wuppi
manute hat geschrieben:
versteh ich eigentlich nicht, wieso ich mit # kein Highlight mehr habe
weil jan sich vertippt hat. :D er meinte, das #, und was dahinter steht, wird gar nicht an den server übermittelt, da es nur für den browser relevant ist.
deswegen kann das phpbb-script es auch nicht auslesen und nicht highlighten, logisch oder?
Jepp logisch ... gerade mal $_SERVER['REQUEST_URI'] ausprobiert - aber das geht ja auch vom Server aus - und für den Server ist # nicht existent ... :( ...

Da stell ich mir jetzt schon zum 2.mal heute die Frage: warum sind Foren so bescheiden auf SuMas vorbereitet :( ... die Lösung die es doch gibt, fallen doch eher unter "Notgedrungen" - eine richtig saubere Lösung hab ich noch nicht gesehen :(

Bis denne
Wuppi

Verfasst: 12.06.2004, 13:25
von ollipop
manute hat geschrieben:
Wenn ich intern auf der Seite ohne "?" linke und alle anderen mit "?" auf mich linken - bekommt diese Seite einen PR "vererbt"?
google wird, wenn der content wirklich exakt gleich ist, nur eine von beiden im index behalten. kein index, kein pr.
Wird aber als Backlink gewertet?

Verfasst: 12.06.2004, 13:32
von manute
Wird aber als Backlink gewertet?
ob ein link auf die wegen duplicate content ausgeschlossene seite auch (voll) gewertet wird, ist ne gute frage. weiß ich nicht. ausprobieren. :D

Verfasst: 12.06.2004, 17:53
von ollipop
Ich könnte ja bei den Seiten, die mit "?" aufgerufen werden den MetaTag auf "noindex" setzen? Wird das dann trotzdem als Backlink gewertet?

Verfasst: 12.06.2004, 17:54
von ollipop
Wuppi,

bist du schon weiter gekommen? Hast du schon was Neues gefunden?

Verfasst: 12.06.2004, 18:31
von Wuppi
ollipop hat geschrieben:Wuppi,

bist du schon weiter gekommen? Hast du schon was Neues gefunden?
Kenn mich in sachen Suchmaschinenlogik net so aus ;) :( Man müsste google mal anschreiben, das sie ihren Bots beibringen, das bei einem bestimmten Zeichen die URL aufhört (in der robots.txt zu definieren) *G* ... werden die sicher voll draufeingehen ;)

Ich denke mal so: die SuMas haben bestimmt nicht soviel KI, das sie in Foren selbstständig suchen - es geht also eigentlich nur darum das beim crawlen gepostete html&highlight-Urls gefunden werden - das diese sauber in den Index kommen ... aber wieviele solcher URLs werden gepostet? Sicher wenig ... Meinst gibt es die einfache URL geboten.

Bis denn
Wuppi

Verfasst: 12.06.2004, 19:40
von Southmedia
Urls mit "&highlight=xyz" sind ja eigentlich ziemliche Duplikate von der selben Seite ohne diesem Parameter. Wirklich sinnvoll die Seite in den Index rein zu kriegn ist es meiner Meinung nach nicht, man könnte also einfach über die Metatags diese Seiten vom Spidern ausschliessen.

Verfasst: 13.06.2004, 04:57
von Wuppi
Hi

@Southmedia: da ich gerade ziemlich am SuMa-Optimieren bin stoß ich oft auf die Reaktion "doppelte Seiten" sind doch nicht schlimm, warum also die mühe machen, diese soweit wie möglich zu reduzieren ... für mich persönlich isses Spam ... wie bewerten das SuMas (insbesondere google)? Kick der jeweiligen Seiten? andere Sanktionen?

Ausschließen in den Metatags klappt leider nicht :( (ein und die selben Metatags auf allen Seiten - so im Template des Forums festgelegt) ... vorallem so differenziert wird schwer ... aber über eine gute möglichkeit für nen phpbb2 würd ich mich freuen ;)

Leider schluckt google die robots.txt nicht 100% - sonst würd ich das darüber ausschließen ... naja aber &highlight=xyz ... da kommt google ja nur über Posts im Forum dran => und das kommt nicht so oft vor - glaub die mühe ist es fast nicht mehr wert ....

Bis denne
Wuppi