Seite 1 von 1

DC wie bei Google ausblenden

Verfasst: 23.08.2008, 11:22
von osteuropa
Hallo


Es geht um unsere Seite fachzeitungen . de
Die Datenbank ist sei 10 Jahren unverändert, lediglich der Content wurde angepasst.

Im Webmastertool bekommen ich nun die Meldung von zig tausend doppelten Seiten.

Der Grund ist folgender.
Beispiel:
Der Titel einer Zeitschrift wurde vom Verlag unter Sport eingetragen. Da der Titel auch in die Rubrik Gesundheit past, kann der Verlag auch eine Verzeigung dort eintragen. Somit ist der gleiche Inhalt zweimal im Portal. Manche Titel sind bis zu fünfmal im System.


Dies ist aber schon seit 8 Jahren so. Nun wollen wir keine mögliche Abwertung bei Google hinnehmen. Nur mit welcher Technik sollen wir die Doppelseiten bei Google ausblenden lassen.


Danke für Hinweise

Grüße
Osteuropa

Verfasst:
von

Hochwertiger Linkaufbau bei ABAKUS:
  • Google-konformer Linkaufbau
  • nachhaltiges Ranking
  • Linkbuilding Angebote zu fairen Preisen
  • internationale Backlinks
Wir bieten Beratung und Umsetzung.
Jetzt anfragen: 0511 / 300325-0

Verfasst: 23.08.2008, 12:10
von MrTunes
Versteh ich nciht. Habt ihr doppelte Seiten oder nicht?
Wozu braucht man doppelte Seiten?

Oder geht es darum, dass zwei Seiten gleiche <title></title> haben?

Verfasst: 23.08.2008, 12:25
von osteuropa
MrTunes hat geschrieben:Versteh ich nciht. Habt ihr doppelte Seiten oder nicht?
Wozu braucht man doppelte Seiten?

Oder geht es darum, dass zwei Seiten gleiche <title></title> haben?

Ja, wir haben oft zwei völlig gleiche Seiten.
Nur einmal steht die Zeitschrift in Rubrik Sport und noch unter Gesundheit.
Da die Zeitschrift identisch ist, sind die Angabe halt doppelt.

Wie kann ich das bei Google ausblenden lassen? Im Robot.txt oder wie am besten?

Grüße

Verfasst:
von
Content Erstellung von ABAKUS Internet Marketing
Ihre Vorteile:
  • einzigartige Texte
  • suchmaschinenoptimierte Inhalte
  • eine sinnvolle Content-Strategie
  • Beratung und Umsetzung
Jetzt anfragen: 0511 / 300325-0

Verfasst: 23.08.2008, 21:42
von Mork vom Ork
osteuropa hat geschrieben:Ja, wir haben oft zwei völlig gleiche Seiten.
Nur einmal steht die Zeitschrift in Rubrik Sport und noch unter Gesundheit.
Da die Zeitschrift identisch ist, sind die Angabe halt doppelt.
Eine Zeitschrift - eine URL. Ich würde behaupten, dass sich jede Zeitschrift in einer Hauptrubrik einorden lässt und alles weitere eine Frage des Inhaltsverzeichnisses ist. Es spricht nichts dagegen, im Inhaltsverzeichnis bzw. dem Menü den Verweis auf /sport/abc/ einmal unter der Überschrift Sport aufzuführen und zusätzlich unter der Überschrift Gesundheit.

Wenn ihr nun aber glaubt, unbedingt dieselbe Zeitschrift unter einem halben Dutzend URLs einstellen zu müssen, könntet ihr euch entweder daran halten, dass die Mär vom pösen toppelten Inhalt™ nur Leute betrifft, die eh fragwürdige Inhalte haben, oder ihr setzt mit Content-Location einen klaren Hinweis darauf, dass die URL X lediglich eine Kopie von URL Y ist.
Dass die URL einen gigantischen Einfluss auf die Platzierung haben soll, halte ich übrigens mittlerweile auch für eine Mär. Es ist ja nicht so, dass die Leute bei Google die letzten wären, denen auffällt, dass es seit zwei, drei Jahren modern ist, die URLs mit Schlüsselwörten so vollzumüllen, wie es vor zehn Jahren mit <meta>-keywords der Fall war.
Dies ist aber schon seit 8 Jahren so. Nun wollen wir keine mögliche Abwertung bei Google hinnehmen.
Warum sollten jetzt auf einmal eure Seiten abgewertet werden? Vor doppelten Inhalten fürchten sich gewisse Kreise seit Jahren, wenn da was passieren könnte, wäre das schon längst passiert.
Wie kann ich das bei Google ausblenden lassen? Im Robot.txt
Kann man auch machen, sieht in den Ergebnislisten der Suchmaschinen aber nicht so hübsch aus, weil da dann nur noch die URL auftaucht, kein Titel, kein Auszug, nüscht, was Interesse wecken könnte.

Verfasst: 23.08.2008, 22:17
von Burns
Hallo,

ich würde die Linkstruktur anpassen

derzeit ist es bei euch so dass zwei verschiedene Links den gleichen Web-Inhalt haben

Sport > sport123.htm
Gesundheit > gesundheit123.htm

sport123.htm = gesundheit123.htm

Ich würd es so umbauen das die zwei verschiedenen Rubriken auf ein Inhalt linken.

Sport > ausgabe123.htm
Gesundheit > ausgabe123.htm


nur sone Idee, ohne die Webseite gesehen zu haben kann ich nicht beurteilen obs überhaupt machbar ist.



-

Verfasst: 23.08.2008, 22:24
von jackwiesel
Presseportale und/oder juristische sind eh so ne Sache. Da werden immer wieder Mitteilungen, Artikel oder Urteile DC verursachen - normal sollte der Gockel das doch erkennen...?

Da ich mit DC so gut wie nix am Kopp habe halte ich mal den Rüssel.........

Verfasst: 23.08.2008, 22:36
von Burns
G00gle erkennt DC prima nur zuordnen wer der Urheber ist und wer die Kopie hat, das ist das Problem

Verfasst: 24.08.2008, 14:41
von osteuropa
Mork vom Ork hat geschrieben:
osteuropa hat geschrieben:Ja, wir haben oft zwei völlig gleiche Seiten.
Nur einmal steht die Zeitschrift in Rubrik Sport und noch unter Gesundheit.
Da die Zeitschrift identisch ist, sind die Angabe halt doppelt.
Eine Zeitschrift - eine URL. Ich würde behaupten, dass sich jede Zeitschrift in einer Hauptrubrik einorden lässt und alles weitere eine Frage des Inhaltsverzeichnisses ist. Es spricht nichts dagegen, im Inhaltsverzeichnis bzw. dem Menü den Verweis auf /sport/abc/ einmal unter der Überschrift Sport aufzuführen und zusätzlich unter der Überschrift Gesundheit.

Wenn ihr nun aber glaubt, unbedingt dieselbe Zeitschrift unter einem halben Dutzend URLs einstellen zu müssen, könntet ihr euch entweder daran halten, dass die Mär vom pösen toppelten Inhalt™ nur Leute betrifft, die eh fragwürdige Inhalte haben, oder ihr setzt mit Content-Location einen klaren Hinweis darauf, dass die URL X lediglich eine Kopie von URL Y ist.
Dass die URL einen gigantischen Einfluss auf die Platzierung haben soll, halte ich übrigens mittlerweile auch für eine Mär. Es ist ja nicht so, dass die Leute bei Google die letzten wären, denen auffällt, dass es seit zwei, drei Jahren modern ist, die URLs mit Schlüsselwörten so vollzumüllen, wie es vor zehn Jahren mit <meta>-keywords der Fall war.
Dies ist aber schon seit 8 Jahren so. Nun wollen wir keine mögliche Abwertung bei Google hinnehmen.
Warum sollten jetzt auf einmal eure Seiten abgewertet werden? Vor doppelten Inhalten fürchten sich gewisse Kreise seit Jahren, wenn da was passieren könnte, wäre das schon längst passiert.
Wie kann ich das bei Google ausblenden lassen? Im Robot.txt
Kann man auch machen, sieht in den Ergebnislisten der Suchmaschinen aber nicht so hübsch aus, weil da dann nur noch die URL auftaucht, kein Titel, kein Auszug, nüscht, was Interesse wecken könnte.

Danke Mork vom Ork für den Hinweis.
Mein Programmierer hat dies heute sofort umgesetzt.

Hier unser Ergebnis für den Titel:
05 Deutsches Handwerksblatt Gesamt
A - Z Fachbereiche >> Handel - Groß-Außenhandel - Gewerbe
url
fachzeitungen.de/seite/p/katdet/katid/22/katidsub/45

hier ein Untertitel, so nennen wir dies
A - Z Fachbereiche >> Handwerk > Handwerk- Gewerbe - Industrie
08 Deutsches Handwerksblatt Gesamt
url
fachzeitungen.de/seite/p/titel/titelid/1004612985/katid/23/katidsub/31

Ergebins ist ja im Quellcode

wir haben auch an eine Umleitung zum Haupttitel gedacht. Aber dann ist der Besucher in einer anderen Rubrik gelandet. Dies ist auch nicht schön.

Würde mich über weitere Bemerkungen zur Programmierung freuen.
Hoffe Google ist damit zufrieden.

Grüße
osteuropa

Verfasst: 25.08.2008, 14:52
von Mork vom Ork
osteuropa hat geschrieben:
ihr setzt mit Content-Location einen klaren Hinweis darauf, dass die URL X lediglich eine Kopie von URL Y ist.
Mein Programmierer hat dies heute sofort umgesetzt.
HTTP-Angaben wie Content-Location gehören entweder direkt in den HTTP-Antwortkopf oder, in allerschlimmster Not, in ein <meta>-http-equiv im HTML-Code, aber nicht in ein <meta>-name.

Sofern die Seite von PHP ausgespuckt wird, wäre die richtige Vorgehensweise das Einfügen der Zeile „header("Content-Location: https://www.fachzeitungen.de/" . $zeitschriftenpfad);“. In anderen Sprachen besteht diese Möglichkeit grundsätzlich ebenfalls, der Funktionsaufruf sieht nur anders aus.

Und wo ich dabei bin: Dies …
<meta http-equiv="language" content="de">
<meta http-equiv="robots" content="index,follow">
… ist der genau umgekehrte Fall. Diese Daten haben im HTTP-Bereich nichts zu suchen, hier ist <meta>-name richtig. Language ist zudem schon (völlig richtig) in Form des standardisierten Content-Language vorhanden, also raus mit Language.

Eure <meta>-keywords sind viel zu unspezifisch und dementsprechend viel zu lang. Stichworte wie Titel, Verlag, Volltext oder Datenbank lassen sich in gleicher Weise auf das halbe Web beziehen. Um die Hälfte kürzen. Mindestens. (Ich täte ja ganz radikal nur „Zeitschriften,Fachzeitschriften“ nutzen, im Verzeichnis erweitert um die jeweilige Kategorie, also zum Beispiel „Zeitschriften,Fachzeitschriften,Gastronomie“.)

Was soll dies aussagen: <meta name="classification" content="Internet,Internet Services">? Dass eine Webseite was mit dem Internet zu tun hat, liegt doch irgendwie nahe. Raus damit.
<meta name="distribution" content="Global">
<meta name="audience" content="Alle">
<meta name="page-type" content="Verzeichnis">
<meta name="rating" content="general">
„Global“, „alle“ und „general“ sind keine nennenswerten Aussagen. Davon abgesehen werden diese Daten von so ziemlich niemandem ausgewertet, und wenn doch, dürfte eine ausländische Suchmaschine mit deutschen Begriffen wie „Alle“ oder „Verzeichnis“ nichts anfangen können. Raus damit.
<meta name="revisit-after" content="2 days">
Hält sich keine Suchmaschine dran bzw. wenn, dann bestenfalls in Form einer Verzögerung (à la „nur alle 3 Monate, nicht jeden Tag“). Raus damit.
<meta name="robots" content="FOLLOW,INDEX">
Macht jede Suchmaschine von ganz alleine. Raus damit.
<meta name="expires" content="0">
Kontraproduktiv. Kein Cache behält Seiten eigenmächtig länger als ein paar Stunden und so oft ändern sich eure Seiten nicht. Das Verhindern des Zwischenspeicherns erhöht nur die Ladezeit und Serverlast.
<meta name="copyright" content="Copyright 1998 by Deutsche Internet Portals LTD">
<meta name="programmer" content="webAID - https://www.webAID.de/">
Datenrauschen …

<title>Deutsches Handwerksblatt Gesamt bei fachzeitungen.de: Deutsches Handwerksblatt Gesamt Ihre Zeitschrift im Portal für Fa</title>
Da ist am Ende was runtergefallen, und einen sprachlich etwas schöneren und kürzeren Titel könnt ich mir für meine Lesezeichen auch vorstellen.

fachzeitungen.de/seite/p/titel/titelid/1004612985/katid/23/katidsub/31
Eure URLs täte ich in etwa so aufbauen:

Einzelne Zeitschrift: /verzeichnis/titel/a/123/ bis /verzeichnis/titel/z/456/
Bereiche: /verzeichnis/fachbereich/land-und-forstwirtschaft/jagd-und-fischerei/ oder /verzeichnis/fachbereich/23/31/
Verlage: /verzeichnis/verlag/a/ bis /verzeichnis/verlag/z/

Übersichtsseiten auf den jeweiligen Ebenen, wie jetzt schon teils vorhanden.

Nach so viel Meckerei: Interessantes Verzeichnis, erstaunlich, was so alles gedruckt wird.