Seite 1 von 1

robots.txt index.html?seite.html löschen

Verfasst: 07.10.2006, 04:26
von Toonz
Hallo Zusammen

Ich hab da ein Problem mit ein paar Seiten die schon lange im Gogl-Index sind.

Es handelt sich um Seiten wie z.B.

xydomain.de/index.html?webdesign_referenz.html

Da diese Seiten den gleichen Inhalt anzeigen wie die Startseite "index.html" bin ich nun nicht sicher ob das vielleicht als doppelter Content gewertet wird da die Seiten ja wie gesagt einzeln im Index sind. Was meint ihr dazu?

Ich habe nun eine robots.txt angelegt:

User-agent: *
Disallow: /index.html?antiviren_infos.html
Disallow: /index.html?share_grafik.html
Disallow: /index.html?home.html
Disallow: /index.html?webdesign_referenz.html

Besteht nun die Gefahr, dass die "index.html" selber nicht mehr durchsucht wird?

Verfasst:
von
Content Erstellung von ABAKUS Internet Marketing
Ihre Vorteile:
  • einzigartige Texte
  • suchmaschinenoptimierte Inhalte
  • eine sinnvolle Content-Strategie
  • Beratung und Umsetzung
Jetzt anfragen: 0511 / 300325-0

Verfasst: 07.10.2006, 06:40
von bbnetch
nein es wird genau das gespert was du angiebst, ausser du schreibst nur index, dann werden auch alle anhaengsel gespert :)

ansonsten lass google deine robots gleich lesen, dann hast die morgen raus :)

https://services.google.com:8882/urlcon ... fullStatus



.

Verfasst: 07.10.2006, 11:40
von Toonz
Alles klar :)

Danke vielmals für die rasche Antwort.

Verfasst:
von
SEO Consulting bei ABAKUS Internet Marketing
Erfahrung seit 2002
  • persönliche Betreuung
  • individuelle Beratung
  • kompetente Umsetzung

Jetzt anfragen: 0511 / 300325-0.


Verfasst: 13.01.2007, 10:28
von a priori
ich habe dazu auch noch mal eine frage:

ich habe auch seiten im index, die ich via robots.txt löschen lassen möchte.
was schreibe ich in die robots.txt bei so welchen urls:

Fall1:
h*tp://www.meineurl.de/c*gi-*in/gue*tbo*ok.php ... w&start=27

--> Disallow: /c*gi-*in/gue*tbo*ok.php.cgi?gbook=0&act*ion=view&start=27


Fall2:(bei session ids)
ht*p://www.meineurl.de/forum/vie*topic.php?t=5 ... d1*6dd7b88

--> Disallow: /forum/vie*topic.php?t=5&high*light=&sid=718*291152bdd*185f0d87d1*6dd7b88

Verfasst: 13.01.2007, 14:36
von OTTIX
Hallo zusammen,

das selbe problem habe ich auch und danke euch für weitere antworten.

Gruss Micha

Verfasst: 22.01.2007, 08:14
von a priori
a priori hat geschrieben:ich habe auch seiten (Session Ids) im index, die ich via robots.txt löschen lassen möchte.was schreibe ich in die robots.txt bei so welchen urls:
Habe mittlerweile festgestellt das Google die Session Ids problemlos aus dem Index löscht. Einfach die volle Url nach diesem Schema angeben:

Disallow: /forum/vie*topic.phpt=5&high*light=&sid=718*291152bdd*185f0d87d1*6dd7b88