Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Google Sitemap Filter?

Dieses Forum ist für Informationen über Google gedacht (Ausser PageRank!).
Neues Thema Antworten
Forenmensch
PostRank 7
PostRank 7
Beiträge: 583
Registriert: 09.02.2005, 23:47

Beitrag von Forenmensch » 04.08.2005, 00:03

Nach viel Zeit und Nerven, habe ich das Script für die automaitsch vom Script generierte Sitemap zum laufen bekommen, der spidert aber auch so ziemlcilh alles was er nicht soll (*.avi *.mp3 usw...)...

Wie kann ich einen Filter setzen, das nur aus dem hauptverzeichnis gespidert wird, bei zusätzlichen (pass = erlaubnis) angaben nur die php files und so...

Generell verstehe ich den Filter ja eh nicht, wenn ich kein PASS drin stehten habe, aber 3x dropzeilen, wieso spidert er dann alles?




Filter in config.xml

Es können Regeln erstellt werden, um bestimmte Dateien mit Hilfe von Filtern aus- oder einzuschließen:

<site>
...
<filter action="drop" type="wildcard" pattern="*/internal/*" />

Erläuterung:

* action="drop" Schließt übereinstimmende URLs aus.
* action="pass" Schließt übereinstimmende URLs ein.

und

* type="wildcard" Beim URL-Abgleich werden standardmäßige Pfadplatzhalterzeichen (* und ?) verwendet.
* type="regexp" Es werden reguläre Ausdrücke verwendet.

Bei Verwendung von Platzhalterzeichen oder regulären Ausdrücken:

* pattern= Gibt das Muster für den Abgleich an.

Filter werden in der Reihenfolge angewendet, in der sie in der Datei config.xml aufgeführt sind. Das Vermischen von Filtereinträgen mit Eingabeeinträgen (url, urllist, directory oder accesslog) hat keine weiteren Auswirkungen - jede vom Sitemap-Generator zur Sitemap hinzugefügte URL wird zunächst gegen jeden Filter abgeglichen.

Sofern eine URL mit keinem Filter übereinstimmt, wird sie gemäß der Standardeinstellung in die Sitemap aufgenommen.
Ein langer Text, den man nach 5x lesen nichtmal wirklich versteht, umzusetzen...

Denn wie ich nun NUR php files aus dem hauptverzeichnis spidern lassen kann, wird dort nicht erklärt...