Wie kann ich einen Filter setzen, das nur aus dem hauptverzeichnis gespidert wird, bei zusätzlichen (pass = erlaubnis) angaben nur die php files und so...
Generell verstehe ich den Filter ja eh nicht, wenn ich kein PASS drin stehten habe, aber 3x dropzeilen, wieso spidert er dann alles?
Ein langer Text, den man nach 5x lesen nichtmal wirklich versteht, umzusetzen...
Filter in config.xml
Es können Regeln erstellt werden, um bestimmte Dateien mit Hilfe von Filtern aus- oder einzuschließen:
<site>
...
<filter action="drop" type="wildcard" pattern="*/internal/*" />
Erläuterung:
* action="drop" Schließt übereinstimmende URLs aus.
* action="pass" Schließt übereinstimmende URLs ein.
und
* type="wildcard" Beim URL-Abgleich werden standardmäßige Pfadplatzhalterzeichen (* und ?) verwendet.
* type="regexp" Es werden reguläre Ausdrücke verwendet.
Bei Verwendung von Platzhalterzeichen oder regulären Ausdrücken:
* pattern= Gibt das Muster für den Abgleich an.
Filter werden in der Reihenfolge angewendet, in der sie in der Datei config.xml aufgeführt sind. Das Vermischen von Filtereinträgen mit Eingabeeinträgen (url, urllist, directory oder accesslog) hat keine weiteren Auswirkungen - jede vom Sitemap-Generator zur Sitemap hinzugefügte URL wird zunächst gegen jeden Filter abgeglichen.
Sofern eine URL mit keinem Filter übereinstimmt, wird sie gemäß der Standardeinstellung in die Sitemap aufgenommen.
Denn wie ich nun NUR php files aus dem hauptverzeichnis spidern lassen kann, wird dort nicht erklärt...