Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Robots sollen nur thread*.html spidern

Alles zum Thema: Robots, Spider, Logfile-Auswertung und Reports
Neues Thema Antworten
Majora
PostRank 4
PostRank 4
Beiträge: 130
Registriert: 27.03.2005, 11:47

Beitrag von Majora » 10.06.2005, 18:25

Hallo,
ich habe mein Foru vor kurzem nach dieser Anleitung hier optimiert: https://www.daniweb.com/techtalkforums/thread9379.html
Nun ist mein Forum so optimiert, wie das Forum von daniweb.com, sogar das Archiv ist gleich.

Nun zu einem Problem, welches mein FOrum von dem von daniweb unterscheidet.

Wenn bei gogle nachschaut, welche Seiten der google Spider von mir und von daniweb gespidert hat, sieht man, dass der Spider bei daniweb nur Threads mit Endungen thread***.html aufnimmt.

Bei mir nimmt der Spider zwar auch Threads mit dieser Endung auf, jedoch auch Threads mit der Endung lastpostinthread**.html und newpostinthread**.html.

Woran liegt das? Kann man irgendwie verhindern, dass der Spider die Seiten mit der Endung lastpostingthread**.html und newpostinthread**.html aufnimmt.

Ich bin für jede hilfreiche Antwort dankbar.

Mein FOrum: https://www.schachfeld.de/

Anzeige von ABAKUS

von Anzeige von ABAKUS »


Hochwertiger Linkaufbau bei ABAKUS:
  • Google-konformer Linkaufbau
  • nachhaltiges Ranking
  • Linkbuilding Angebote zu fairen Preisen
  • internationale Backlinks
Wir bieten Beratung und Umsetzung.
Jetzt anfragen: 0511 / 300325-0

Chris2005
PostRank 9
PostRank 9
Beiträge: 1284
Registriert: 14.04.2005, 23:58

Beitrag von Chris2005 » 10.06.2005, 18:29

Code: Alles auswählen

Robots.txt

User-agent: Googlebot
Disallow: /*?
Disallow: lastpost
Disallow: newpost
Disallow: ...

User-agent: *
Disallow: lastpost
Disallow: newpost
Disallow: ...
Es ist ne ganze Menge, die da ausgeklammert werden muss. Neuer Post, Forum als gelesen markieren, Boarduser, FAQ, online-user, Kalender, Suchfunktion etc.

Majora
PostRank 4
PostRank 4
Beiträge: 130
Registriert: 27.03.2005, 11:47

Beitrag von Majora » 11.06.2005, 18:12

Chris2005 hat geschrieben:

Code: Alles auswählen

Robots.txt

User-agent: Googlebot
Disallow: /*?
Disallow: lastpost
Disallow: newpost
Disallow: ...

User-agent: *
Disallow: lastpost
Disallow: newpost
Disallow: ...
Es ist ne ganze Menge, die da ausgeklammert werden muss. Neuer Post, Forum als gelesen markieren, Boarduser, FAQ, online-user, Kalender, Suchfunktion etc.

Muss hinter lastpost und nepost kein .php oder geht das auch ohn das