Seite 1 von 1

Google indiziert Seiten die es gar nicht gibt

Verfasst: 04.03.2011, 19:49
von Pums
Hallo ich habe ein großes Problem.
Google indiziert Seiten welche es gar nicht gibt.
Ich habe eine Sitemap erstellt mit links ala:
www.domain.de/irgendwas.html

Dazu eine htaccess:

Code: Alles auswählen

<IfModule mod_rewrite.c>
RewriteEngine On
RewriteRule &#40;&#91;a-zA-Z0-9äöü%-&#93;*&#41;.html$ /index.php &#91;L&#93;
</IfModule>
Google hat nun aber eine Seite:
www.domain.de/index.php?show=epk
indiziert.
Sogar keyword werden aus dieser Seite gezogen.
Allerdings kann diese Seite nicht aufgerufen werden.
Die normalen Seiten werden gar nicht indiziert, liegt aber vllt. an was anderem.

Nur warum indiziert Google Seiten, welche nicht existieren?

Die Seite kann auch nicht vorher indiziert worden sein, da Sie vorher nie online aktiv war.

Verfasst:
von

Verfasst: 04.03.2011, 21:07
von SojaSEO
Vielleicht bist du oder ein Besucher mal mit der Google Toolbar auf diesen Unterseiten gesurft. Oder eine Scraper-Seite verlinkt dich mit dieser seltsamen URL.

Verfasst: 04.03.2011, 21:12
von Pums
Gut das kann sein, muss ich mal die Leute fragen die die Seite getestet haben, allerdings war sie die ganze Zeit im Wartungsmodus und man kam nur mit PW dran.
Schmeisst google eine seite welche nicht mehr erreichbar ist automatisch wieder raus oder muss man bescheid geben?

Verfasst:
von

Verfasst: 04.03.2011, 21:21
von bugscout
Was macht denn dein System, wenn man index.php?show=epk aufruft?

Wenn es die index.php zeigt, existiert index.php?show=epk auch.
Da brauch die Seite dann nur von irgendwo auf der Welt so angelinkt werden
und schon hast du dein Problem

Mambo/Joomla war z.B. so ein Vertreter, der alles angezeigt hat

irgendwo hab ich noch ein
RewriteCond %{QUERY_STRING} .*iframe=true.* [OR]
in meiner .Htaccess,

weil an diversen Urls immer &iframe=true dranhing

Verfasst: 04.03.2011, 21:28
von Pums
Es ruft die Fehlerseite auf das die Seite nicht existiert.
Also eine eigene Fehlerseite.
Hier der Text der dann kommt:
Fehler 404 - Seite nicht gefunden

Die von Ihnen aufgerufene Seite wurde nicht gefunden.
Sie werden in wenigen Sekunden auf die XXX.de
weitergeleitet...

Falls nicht bitte hier klicken.

Hier der html-Code:

Code: Alles auswählen

<html>

<head>
<meta http-equiv="Content-Language" content="de">
<meta http-equiv="Content-Type" content="text/html; charset=windows-1252">
<title></title>
</head>

<body>

<p align="center">&nbsp;</p>

<p align="center">
Fehler 404 - 
Seite nicht gefunden</p>
<p align="center">Die 
von Ihnen aufgerufene Seite wurde nicht gefunden.<br>
Sie werden in wenigen Sekunden auf die xxx weitergeleitet...</p>
<p align="center">Falls nicht bitte <a href="index.php">hier</a> klicken.</p>

</body>

</html>
Ich tausche dann mal den htaccessinhalt gegen deinen(natürlich angepasst) aus, danke vllt. klappts ja dann.

Verfasst: 05.03.2011, 01:19
von Rem
Google hat nun aber eine Seite:
www.domain.de/index.php?show=epk
indiziert.
Ich vermute böse, dass Google mit Deinen Parametern rumspielt. Im Prinzip will Google unnötige Parametern weglassen, nimmt die kürzeste Version mit gleichem Inhalt - sozusagen auch als Schutz vor DC - in den Index auf [= indexiert]. Da steckt nicht unbedingt ein Nutzer oder ein Toolbar dahinter, der sozusagen Google die URL steckte...

In Deinem Fall würde ich einfach mal auf solche "Testläufe" tippen. Ob das wirklich im Index erscheint, hast Du ja bisher nicht geschrieben.

Logg mal in Webmastertools ein: dort listet Google übrigens "Soft 404"-Seiten auf, worunter dann Deine Quasi-404-Seiten schön passen würden.

Auch hier: Der Quelltext Deiner 404 ist ja schön und gut, was allerdings im Header ausgegeben wird, wäre deutlich interessanter.

ALSO: solange die Seite nicht im Index erscheint, würden bei mir die Alarmglocken nicht läuten. Auch nicht, falls die Seiten im Webmastertools unter Soft 404 aufgelistet würden.

Das einzige, wo bei mir die Alarmglocken läuten würden, ist, wenn eine Content-Seite im Google-Index durch eine Müllseite ersetzt wird. Aber Google hat da dazugelernt.

Verfasst: 05.03.2011, 16:49
von Pums
Also man findet die Seite nicht bei google.
Nur bei Webmastertools werden halt die keyword angezeigt.
Ausserdem wird bei html-vorschläge die kurze mtebeschreibung bemängelt(ja klar gibts bei der seite ja auch nicht*G*).
Also kann es einfach sein das google aus welchen gründen auch immer doch mal wind von der Seite bekommen hat und diese nun einfach drin ist.
Ich hoffe mal das wenn er die neuen Seiten mitbekommt sich das ganze dann wieder zurechtbiegt.

Die show=epk seite ist ja eine Content Seite und google hat auch die keywords aus dieser Contentseite gezogen, sogar die richtigen.
Nur Frage ich mich wie google das hinbekommen hat.

Soft404-Seiten zeigt er bei mir nicht an.
(Du meinst doch unter crawlingfehler oder?)

Verfasst: 06.03.2011, 21:21
von Tradinger
Vielleicht völlig abwegig, aber ich hatte ausversehen mal eine Sitemap eingereicht, die zuviele Informationen enthielt, so dass Google auf Seiten gestoßen ist, die gar nicht mehr existiert haben.