Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Sitemap anderer Websites?

Hier können Sie Ihre Fragen zum Thema Suchmaschinenoptimierung (SEO) / Positionierung stellen
fa_herrmann
PostRank 2
PostRank 2
Beiträge: 31
Registriert: 24.12.2006, 14:41

Beitrag von fa_herrmann » 29.12.2006, 22:51

Hi AnjaK,
AnjaK hat geschrieben:LAut Google sollten es nicht mehr als 100 interne Links sein. Das hat sicher seinen Grund (wahrscheinlich damit der Bot nicht zu lange lesen muss). Aber darüberhinaus wird dennoch gespidert.
Nöh, nicht Empfehlungen a la "you may/should..." zählen, sondern das, was als Sitemap-Protokoll-Standard - und der zugehörigen Schemadatei - festlegt ist...;)

Danach darf eine konfome Sitemapdatei...
Google hat geschrieben: ...nicht mehr als 50.000 URLs enthalten und in unkomprimiertem Zustand nicht größer als 10 MB (10.485.760 Byte) sein.
Im zugehörigen XML-Schema findet sich noch einmal der Satz:
Container for a set of up to 50,000 document elements. This is the root element of the XML file...

Braucht man mehr als 50.000 Links muß man mehrere erstellen und darauf wiederum in einer Indexdatei verweisen...
Google hat geschrieben: Bei Angabe von mehr als 50.000 URLs müssen Sie mehrere Sitemapdateien erstellen.
...
Sitemap-Indexdateien dürfen nicht mehr als 1.000 Sitemaps beinhalten.
5 Mio dürfte dann für ambitionierte Hobyprojekte erst einmal reichen;)

Wozu können Sitemapdateien gut sein? Nehmen wir mal eine Immobilienbörse. Die meisten Inhalte werden über parametrisierte Abfragen on the fly erzeugt. Sicher, man kann ein bißchen was über rewritte-Regeln Suma-freundlicher machen. Für komplexere Applikationen macht es allerdings durchaus Sinn, automatisch ein ganzes Bündel statischer Seiten mit vordefinierten Abfragen zu erzeugen und darauf in der sitemap zu verweisen. Ich mache eben genau das...;)

Etwa 400 Zeilen VBScript holen sich die Werte aus der Datenbank, schreiben ein paar Hundert vorgefertigte ASP-Scripte mit jeweils angepassten Keywords, Pagetitle etc. für die Webserver und erzeugen ein Sitemap-XML. Ich finde, das ist dann kein Suchmaschinenspam, weil: Die Seiten sehen natürlich genauso aus, als hätte ein Besucher via Suchwizzard sich eine Abfrage gestrickt, will heißen: Besucher sollen die so erzeugten Seiten ja durchaus auch so sehen.

Werden die Suchabfragen dann vom Benutzer modifiziert, weil ihm das doch ziemlich grobe Ergebnis a la "Alle Bürovermietungen in XYZ" zu viele Treffer liefert, ist er eh wieder in der normalen Applikation... Und ASP-Scripte sind's, weil sie beim Aufruf - sowohl vom Bot als auch vom Besucher - noch einmal interpretiert werden müssen, um sicherzustellen dass wirklich nur Inhalte enthalten sind, die zum Zeitpunkt des Abrufs noch up to date sind... sonst wär's freilich Suma-Spam...;)

Jetzt überlege ich nur noch, ob ich nicht meinem Script noch die zehn Zeilen gönne und versuche, auch das Einreichen der XML-Daten bei Google zu automatisieren...;)


@all
Was soll schlecht daran sein, eine Sitemap-XML auch sitemap.xml zu nennen? Ich _will_ die ja veröffentlichen. Und jJa, ich will auch die darin enthaltenen Informationen veröffentlichen. Ergo darf die auch jeder lesen, wenn er/sie gern XML-Daten liest.

BTW: Unser Produktionssteuersystem schreibt XML-Dateien, die schon mal 24 MB und mehr werden. Die zu lesen macht gar keinen Spaß;) Aber das ist schon wieder eine gaaanz andere Geschichte...

cul,
Falk

Anzeige von ABAKUS

von Anzeige von ABAKUS »


Hochwertiger Linkaufbau bei ABAKUS:
  • Google-konformer Linkaufbau
  • nachhaltiges Ranking
  • Linkbuilding Angebote zu fairen Preisen
  • internationale Backlinks
Wir bieten Beratung und Umsetzung.
Jetzt anfragen: 0511 / 300325-0

innuendo
PostRank 8
PostRank 8
Beiträge: 776
Registriert: 13.06.2003, 14:18
Wohnort: Linz/OÖ

Beitrag von innuendo » 29.12.2006, 23:47

In Zeiten wie diesen zählt imho rein die Übermittlung einer Sitemap via XML an die Suchmaschinenbetreiber (https://www.sitemap.org). Eine Aufteilung über eine HTML-Seite bzw. mehrere Seiten ist schon nahezu altmodisch (für Live wirds auch bald eine Abhilfe geben - und bis dorthin ist der Marktanteil doch eher vernachlässigbar). Wenn in der 3. Ebene bereits Schluss ist bei mehr als 10.000 Seiten, dann ist die Website wohl eher mager strukturiert und ein potentieller menschlicher Besucher würde wohl den Überblick verlieren. Dazu fällt mir dann folgendes von Googles Quality Guidelines ein:
"Another useful test is to ask, "Does this help my users? Would I do this if search engines didn't exist?"
Unübersichtliche Struktur wohl eher nicht und könnte mir sehr gut vorstellen, dass G & Co auf solche Sitemaps "heiß" sind.

lg,
Innuendo

innuendo
PostRank 8
PostRank 8
Beiträge: 776
Registriert: 13.06.2003, 14:18
Wohnort: Linz/OÖ

Beitrag von innuendo » 29.12.2006, 23:50

@fa_hermann

Man kann auch die Sitemap.xml zu asdfasdfjlk.xml umbenennen und diese an G & Co übermitteln. Feel free - besonders diejenigen die Angst vor Kollegen haben, die bisschen stöbern.

Innuendo

Anzeige von ABAKUS

von Anzeige von ABAKUS »

SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


rechtlegal
PostRank 9
PostRank 9
Beiträge: 2874
Registriert: 20.04.2005, 17:23
Wohnort: Tespe / Elbe (daneben ist Hamburg)

Beitrag von rechtlegal » 30.12.2006, 00:03

Klassischerweise dient die altmodische html-Sitemap der erleichterten Auffindung von Unterseiten (Stichwort: mit 2 Clicks erreichbar). Ich rede aber auch nicht von 100k Unterseiten.

Matthias711
PostRank 3
PostRank 3
Beiträge: 72
Registriert: 29.11.2006, 08:56

Beitrag von Matthias711 » 30.12.2006, 10:29

Ich persönlich habe/hatte mich auch entschlossen die Google-Sitemap-Funktionen zu nutzen, da Google einfach nicht alle Seiten spidern bzw. aktualisieren wollte... Mittlerweile bin ich der Meinung, daß man darauf auch ganz gut verzichten kann, denn wenn man eine gute, crawlerlesbare Linkstruktur besitzt und einen guten PR (4-5), dann spidert Google wahrscheinlich auch ohne Sitemap relativ regelmäßig... Bei mir jedenfalls dauert es auch mit Sitemap machmal 2 -3Monate bis Google aktualisierte Inhalte findet oder neue Seiten aufnimmt... Natürlich will ich Google den guten Willen auch nicht völlig absprechen, aber es passiert halt nichts, die Sitemap wird regelmäßig gelesen, für gut befunden und irgendwo ist dann der Flaschenhals-Engpass bei G, mit oder ohne Sitemap... Vielleicht hilft die Sitemap aber doch ein wenig dabei, der zufälligen Indexierung auf die Sprünge zu helfen bzw. seine Inexierungschance zu verdoppeln...

Bis dann, Matthias

namenloser
PostRank 5
PostRank 5
Beiträge: 224
Registriert: 01.11.2005, 19:46

Beitrag von namenloser » 30.12.2006, 13:53

Wenn ich ein XML Sitemap erstelle, wie muss ich die dann verlinken, als normalen Links mit Titel Sitemap kann ich das ja nicht machen weil die xml sitemap ja niemand normales lesen kann, kann es vielleicht sein das man so eine xml sitemap wohl eher mit einem <link> Tag im head der Seite verlinkt?

MikeK
PostRank 6
PostRank 6
Beiträge: 343
Registriert: 08.07.2006, 13:30
Wohnort: Düsseldorf

Beitrag von MikeK » 30.12.2006, 13:58

Die XML Sitemap ist eher für Google und Co gedacht! (Stichwort: Google Sitemaps oder Yahoo! Site Explorer) Die Verlinkst Du nicht auf Deiner Seite, sondern kannst Sie bei den SuMas anmeldet. Die holen sich die dann selber ab.

Ciao,
Mike

lionstarr
PostRank 4
PostRank 4
Beiträge: 141
Registriert: 22.12.2005, 20:12
Wohnort: Hamburg

Beitrag von lionstarr » 30.12.2006, 14:26

Es gibt zwei unterschiedliche Sitemap-"Arten":
1. Die Google Sitemap, die wohl sehr praktisch sein kann wenn man will, dass eine Seite, die noch nicht durch Verlinkung gefunden wurde, schnell aufgenommen wird-
2. Die normale Sitemap mit einfachen HTML Links auf jede Datei. Diese Sitemap führt zu mehr Links, die der Googlebot verfolgen kann /schneller findet und ist außerdem praktisch für den Besucher, der sich nun vielleicht besser zurecht findet!
mfg,
lionstarr
Warum einfach wenns auch kompliziert geht?
Tutorials zum Thema Linux und Computer

fa_herrmann
PostRank 2
PostRank 2
Beiträge: 31
Registriert: 24.12.2006, 14:41

Beitrag von fa_herrmann » 30.12.2006, 14:27

innuendo hat geschrieben:@fa_hermann
Man kann auch die Sitemap.xml zu asdfasdfjlk.xml umbenennen und diese an G & Co übermitteln. Feel free - besonders diejenigen die Angst vor Kollegen haben, die bisschen stöbern.
Innuendo
...was soll dieser Hinweis? Schreibe ich so unverständlich? Klar kann man die Datei nennen, wie man will.

Wenn ich mich der oben geschilderten Arbeit unteziehe, darf die geschätzte Forenleserschaft getrost davon ausgehen, dass ich das komplette RFC-artige Dokument zum Thema sitemap-Protokoll gelesen habe...;-)

Frage ist allein, welchen Sinn eine andere Benennung machen soll. Die stöbernde "Kollegenschaft" soll ja schließlich alle im XML verzeichneten Links finden. Und zwar im Idealfall im komplett und im Suchergebnis von Google. Es ist also die pure Spielerei, die Sietmap anders zu nennen.

Einen denkbaren Fall mag es noch geben: Man möchte gern eruieren welche Seiten der "Kollege" noch so hat, die aber so besch..eiden auf den Bot gewirkt haben müssen, dass sie nicht im Google Index gelandet sind. Solche Recherchen stellen aber vernünftige Menschen nicht an, nur SEO-Süchtige...;-)

cul,
Falk

fa_herrmann
PostRank 2
PostRank 2
Beiträge: 31
Registriert: 24.12.2006, 14:41

Beitrag von fa_herrmann » 30.12.2006, 14:31

lionstarr hat geschrieben: 2. Die normale Sitemap mit einfachen HTML Links auf jede Datei. Diese Sitemap führt zu mehr Links, die der Googlebot verfolgen kann /schneller findet
...entweder völlig verquer ausgedrückt oder einfach verquer im Geiste...;)

Ein XML nach vorgegebenem validierbarem Schema ist von jeder Maschine natürlich besser zu verarbeiten, als irgendwelche zu parsenden Sitemap-HTML-Dateien, die Mitte der Neunziger Jahre mal in Mode waren und als Ersatz für schlechtüberlegte Navigationsstrukturen herhalten sollten...
cul,
Falk

propaganda
PostRank 9
PostRank 9
Beiträge: 1267
Registriert: 20.08.2004, 14:21
Wohnort: Deutschland

Beitrag von propaganda » 30.12.2006, 14:33

Hallo Falk,

für Deinen Zweck wären wohl "Offline-Browser" wie Webreaper, Blackwidow etc. ideal.

fa_herrmann
PostRank 2
PostRank 2
Beiträge: 31
Registriert: 24.12.2006, 14:41

Beitrag von fa_herrmann » 30.12.2006, 14:39

MikeK hat geschrieben:Die XML Sitemap ist eher für Google und Co gedacht!
..nicht "eher", sondern ausschließlich. Da Google und Co bei der Definition leider nicht daran gedacht haben, im XML ein paar Nodes zuzulassen, welche die enthaltenen Links zusätzlich in eine wie auch immer geartete Kategorisierung zu bringen, ist die sitemap-Datei zu sonst nichts zu gebrauchen. Ich finde aber, das reicht auch. Wer seine User zusätzlich mit einer altertümlichen Sitemapdate - besser: Website-Übersiicht - erschlagen mag, könnte ja - um den Programmieraufwand nur einmal zu haben - eine Transformation über die sitemap-XML jagen. Die würde allerdings nur Sinn machen, wenn das Schema zusätzliche beschreibende Nodes zulassen würde. Ich habe das Schema jetzt nicht im Kopf...

Momentan ist jede URL in der Datei gleichwertig, jeder URL-Node besteht nur aus diesen Angaben:

<url>
<loc>https://...</loc>
<lastmod>2006-12-29T19:45:01+01:00</lastmod>
<changefreq>daily</changefreq>
<priority>0.5</priority>
</url>

cul,
Falk

fa_herrmann
PostRank 2
PostRank 2
Beiträge: 31
Registriert: 24.12.2006, 14:41

Beitrag von fa_herrmann » 30.12.2006, 14:41

propaganda hat geschrieben:Hallo Falk,

für Deinen Zweck wären wohl "Offline-Browser" wie Webreaper, Blackwidow etc. ideal.
...für ein ambitioniertes Hobbyprojekt mit einigen Hundert Seiten mag das ja ein ernstzunehmender Hinweis sein...;-) Ich spreche von einem "etwas" größerem Projekt.

cul,
Falk

propaganda
PostRank 9
PostRank 9
Beiträge: 1267
Registriert: 20.08.2004, 14:21
Wohnort: Deutschland

Beitrag von propaganda » 30.12.2006, 14:44

Entschuldige bitte.
Ich denke wohl in zu kleinen Dimensionen.

fa_herrmann
PostRank 2
PostRank 2
Beiträge: 31
Registriert: 24.12.2006, 14:41

Beitrag von fa_herrmann » 30.12.2006, 15:04

propaganda hat geschrieben:Entschuldige bitte.
Ich denke wohl in zu kleinen Dimensionen.
...kein Problem. Ich und meine Mitarbeiter machen das ja auch nicht aus Altruismus, sondern im Angestelltenverhältnis...;-))

cul,
Falk

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag