Beispiel: ich habe eine Seite die von mehreren URLs erreichbar ist und aus diesem Grund sind canonical URLs angegeben (wegen DC Problem). Nur was genau soll in die sitemap.xml rein? Entweder die verschiedenen URLs auf die Seite oder nur die canonical? Oder beide?
Falls die Frage aufkommt warum mehrere URLs für eine Seite: das hat schon Sinn, es handelt sich um mehrere Kategorien von Seiten, die logischerweise nur 1x vorhanden sind. Deswegen die Frage, wie das am besten (optimal für google) angesteuert wird?
Ok jut, hier noch ein Beispiel, daß es keine Unklarheiten gibt:
Es gibt eine Seite mit vielen Kategorien. Dazu gibt es aber nur EINE Seite, die aber in diesen Kategorien immer wieder aufgerufen wird. Das sieht z.b. so aus:
Das wäre auch das Problem, in dem einen Fall wird die canonical nicht in den Index aufgenommen, sondern nur die anderen. Das war vor 2 Wochen. Einfach weiter warten? Oder ist da wirklich etwas falsch (oder nicht optimal).
Bei dem einen Beispiel sind 69.000 Links in der sitemap (pro Sprache), danach würden nochmal 24.000 Links hinzukommen. Das ist schon ein Stück. Kommt google damit klar, oder ist das über einem "Limit" von google?
@threadi
Ich glaube pimpi geht es weniger um die Größe der Sitemap.
Google hat (meiner Meinung nach) kein Limit, wenn es sinnvoll ist, es sei denn du vermasselst was bei der URL-Struktur und der Bot verschluckt sich, also lieber 20* prüfen ob du auch alles richtig gemacht hast.