Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Inkrementelle Sitemap um Performance zu sparen

Ajax, Hijax, Microformats, RDF, Markup, HTML, PHP, CSS, MySQL, htaccess, robots.txt, CGI, Java, Javascript usw.
Japs
Nutzer/in
Nutzer/in
Beiträge: 1685
Registriert: 18.10.2004, 10:50

Beitrag von Japs » 26.09.2009, 11:15

Na ja, wenn es eine Community ist und sich höchstens 2% ändern, dan brauchst Du doch gar keine Sitenmap - bei sowas sollte doch Google in der Lage sein, durch die anständige interne Verlinkung (wenn es diese gibt) alles auch ohne Sitenmap zu finden :)

Ich würde mir bei Communitys, Foren die Arbeit einer Sitenmap auch höchstesn 1x machen um Google & Co überhaupt mitzuteilen, was zu spiden ist und fertig :)

Trotzdem schließe ich mich CatCat an, wenn Du bei einem Projekt mit 300.000 Seiten schon Probleme hast, wenn mal viel gekrawelt wird, dann würde ich mir schon nach einem gescheiten Server umsehen :)

Gruß Dirk

Anzeige von ABAKUS

von Anzeige von ABAKUS »





Erfolgreiche und optimale Nutzung mit Magento Shopsystemen! Nutzen Sie unsere jahrelange Erfahrung mit Magento Shopsystemen und lassen Sie sich beraten!


Lesen Sie die wichtigsten Magento-Optimierungsmaßnahmen oder kontaktieren Sie uns direkt unter: 0511 / 300325-0


mgutt
PostRank 10
PostRank 10
Beiträge: 3206
Registriert: 08.03.2005, 13:13

Beitrag von mgutt » 26.09.2009, 11:21

Synonym hat geschrieben:Allerdings würde mich schon mal interessieren wie Du das technisch umsetzen willst.

Einfach die neuen Seiten an die Sitemap anhängen reicht ja nicht. Die Sitemap-Index gehört dann ja auch geändert.

Und was ist wenn eine URL gelöscht wurde? Wie entfernst Du die dann aus der entsprechenden Sitemap ohne die komplett neu zu erstellen (etwa per Cron)?
Meine Seiten sind alle dymanisch. Um genau zu sein Communities. D.h. wenn jemand ein neues Thema eröffnet oder ein Thema die zweite Seite erreicht, wird jeweils die URL automatisiert in die Sitemap gepackt. Dazu setze ich den Filepointer einfach auf das Ende der Datei, springe ein paar Zeilen zurück (um den Footer zu überspringen) und füge die neue Zeile ein.

Geht nun ein Mod hin und entfernt ein Thema, ist das Script weniger performant und geht zeilenweise durch die Datei und sucht die entsprechenden IDs. Wobei ich da die Idee hätte, dass man das Thema mit der ID 90.000 in der 2. Sitemap findet und zwar in Zeile 40.000. Falls Topic IDs nicht mehr vorhanden sind, werden diese Bereiche mit Leerzeilen gefüllt. So die erste Idee. Hab aber noch kein technisches Gesamtkonzept.
Ich kaufe Dein Forum!
Kontaktdaten

mgutt
PostRank 10
PostRank 10
Beiträge: 3206
Registriert: 08.03.2005, 13:13

Beitrag von mgutt » 26.09.2009, 11:23

Japs hat geschrieben:
....da wir einfach keine Möglichkeit hatten die optimal auszuliefern, ohne gleich einen cronjob aufzubauen oder den Server mit dieser "unendlichen" Schleife ins Nirvana zu jagen etc.
Muß es doch gar nicht :) wenn Du 1x die Woche oder alle 14 Tage automatisch eine Sitenmap ersteleln läst, dann ist das doch absolut kein Problem.

Ich lasse über Cronjob 1x in 14 Tagen über https://www.xml-sitemaps.com/standalone ... rator.html mir eine neue Sitenmap erstellen und diese wird dann gleich korrekt abgelegt - alles sehr einfach :)

Gruß Dirk
Alle 14 Tage? Sorry, aber wie willst Du da jemals konkurrenzfähig sein? Also für meine Seite wäre das viel zu langsam und bei der Masse an Seiten auch nicht steuerbar, weil ich da für jede popelige Domain eine Eintragung vornehmen müsste. Dann doch lieber durch mich selbst und automatisiert.
Japs hat geschrieben:
Synonym hat geschrieben:@Japs
Ja und Nein. Das von Dir benannte Tool geht schon, aber wenn die Domain, so wie meine, etwa 300.000 Unterseiten hat, dann geht der Server schon fast offline wenn der Spider da durch jagt.
Sorry, aber dann hoste auf einem besseren Server :)
Wenn es hier schon Probleme gibt, was machst Du dann wenn Du zb. bei einer Aktion zeitgleich 300.000 Besucher hast - sowas sollte ein Server schon verkraften können :) Gerade wenn amn so ein großes Projekt laufen hat.

Gruß Dirk
300.000 Besucher zeitgleich? Also 1.000 sind ja schon übel, aber 300.000? Unter "zeitgleich" verstehe ich parallel laufende HTTP-Prozesse und da ist mein Server schon gut mit 100 ausgelastet. :P
Ich kaufe Dein Forum!
Kontaktdaten