Unvollständige Google-Sitemap => Problem?

Beitrag von **cyberradler** » 16.02.2006, 13:22

Hallo,

ich möchte die Google-Sitemap für ein Projekt einrichten und habe mich dabei gefragt, was mit indizierten URLs passiert, die nicht in der Sitemap aufgeführt werden, aber ganz normal über die Homepage erreicht werden können. Werden diese dann aus dem Index geworfen oder bleiben sie drin? In den Google-FAQs habe ich dazu nichts gefunden. Habt Ihr damit schon Erfahrungen gemacht?

Gruß
Markus

von **Anzeige von ABAKUS** »

Beitrag von **sammy88** » 16.02.2006, 13:52

Hallo!

Ich habe folgendes vorgenommen:

1.) Ich habe die Site erstellt und eine sitemap gebaut
2.) Ich habe die Site in einigen Webkatalogen eingetragen um überhaupt ein paar links zu bekommen
3.) habe die Sitemap bei google angemeldet.

Ergebnis:
- in der mittlerweile unvollständigen Sitemap sind 140 URLs
- nach 2 Wochen sind über 70 Seiten im Google Index
- auch Seiten, die nicht in der Sitemap gelistet sind sind im Index

Fazit:
- es kommen auch Seiten in den Index, die nicht in der Sitemap sind. Denke auch nicht das die rausfliegen sollten. Warum auch
- die Sitemap-URLs werden nicht komplett auf Schlag übernommen. Auch logisch, denn die müssen ja auch alle erst vom BOT besucht werden.
- Ich denke Sitemap bringt nicht viel, wenn überhaupt, schadet aber auch nicht und man bekommt etwas Statistik für die die es brauchen und mögen.

Sammy

Beitrag von **mediadonis** » 16.02.2006, 14:19

Das Sitemap-Tool dient eher dazu Gurgle zu sagen, wie oft er welche Seiten holen soll (z.B. bei Blogs - jeden Tag die Startseite / jede Woche die Kategorien / jeden Monat das Archiv) -
Natürlich folgt der Bot auch weiterhin jedem Sitewide-Link, und indiziert die Seiten.

von **Anzeige von ABAKUS** »

Beitrag von **ani-K** » 16.02.2006, 16:11

Ich habe ein paar Übersichtsseiten die bei G* eigentlich nicht auftauchen müssen, da sie sich ständig verändern (also bei G* seltenst aktuell sind). Die habe ich aus diesem Grund bei der G*-Sitemap ausgespart.
Diese Seiten waren vorher im Index und sind es heute immer noch.

Da sich G*-Sitemap aber immer noch im Betastadium befindet, kann keine genaue Aussage über das zukünftige Verhalten G* gegenüber den Sitemaps gemacht werden.

Beitrag von **axelm** » 16.02.2006, 16:53

Man ließt euch doch die FAQs richtig durch.

-Die URLs aus der Sitemap kommen in die normale parsing Queue ob der Bot eure URL nun über nen Link oder die Sitemap.xml findet, die kommen alle in die gleiche Liste.

- Wer das Original Python tool von google nutzt, gibt URL und Pfad auf Filesystem und Logs frei.
Anhand des Pfads+Last Modified Date und der Anzahl der Request im Log wird
Datei, Letzte Änderung und wichtigkeit im vergleich zu allen anderen Seiten der Site ermittelt wird, was nicht erfaßt werden soll, kann über config.xml bzw. robots.txt ausgesperrt werden.

Beitrag von **cyberradler** » 16.02.2006, 18:07

Hallo,

ich bin gerade die FAQs noch einmal durchgegangen. Eine klare Aussage zu der Frage steht dort nicht drin. Nur ein paar Formulierungen, die darauf schließen lassen. Aber Google traue ich alles zu...

Gruß
Markus

Beitrag von **axelm** » 16.02.2006, 18:12

Zur Frage: Wenn die Seiten ansurfbar sind bzw. in den Logs sichtbar (und du Zugriff gibt's kommen sie in die Queue).
Das ist aber keine garantie für eine Aufnahme, die Newsgroup zum Thema Sitemaps soll ganz gut besucht sein udn angeblich vom sitemap team gelesen werden.

Beitrag von **cyberradler** » 16.02.2006, 18:30

Klar, das hatte ich auch vermutet, aber es hätte ja auch sein können, dass Google die Sitemap zur Grundlage nimmt und nur noch die dort aufgeführten Seiten indiziert (und somit den Index "säubern" will). Ich werde mich mal in der Newsgroup umsehen.

Gruß
Markus