Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

links per <link rel=

Dieses Forum ist für Informationen über Google gedacht (Ausser PageRank!).
Neues Thema Antworten
biatoss
PostRank 1
PostRank 1
Beiträge: 10
Registriert: 26.12.2006, 00:09

Beitrag von biatoss » 26.12.2006, 00:16

Hallöchen :) eigentlich hatte ich hier schon ein account aber den habe ich verschlamp bzw weiß nich mehr welche der email zum name passt.

Zum Thema;
Ich habe eine für mich interessante entdeckung gemacht, wobei ich noch nicht wirklich weiß wie oder ob man daraus einen vorteil ziehn könnte.

Ich hab das ganze in meinem Blog geschrieben was auch ein paar besucher vertragen kann :)
ganz kurz es geht darum das robots.txt anscheinend nur für inhalt des <body></body> tags gelten.
https://www.biatos.de/google-umgeht-robotstxt.html

wenn ich evtl. in den ansätzen falsch liege bitte kommentieren :) ob hier oder im blog

Anzeige von ABAKUS

von Anzeige von ABAKUS »


Hochwertiger Linkaufbau bei ABAKUS:
  • Google-konformer Linkaufbau
  • nachhaltiges Ranking
  • Linkbuilding Angebote zu fairen Preisen
  • internationale Backlinks
Wir bieten Beratung und Umsetzung.
Jetzt anfragen: 0511 / 300325-0

fw
PostRank 6
PostRank 6
Beiträge: 464
Registriert: 11.07.2005, 23:02

Beitrag von fw » 26.12.2006, 01:28

Mach dich erst mal mit der Syntax der robots.txt vertraut ...

Code: Alles auswählen

Um seine Site ganz von der Indexierung auszuschließen kann man folgendes benutzen&#58;

# Ganze Site für alle Robots sperren
User-agent&#58; *
Disallow&#58; /

Wenn man den Slash &#40;/&#41; wegläßt, gibt man Seine Site ganz für die Indexierung frei&#58;

# Ganze Site freigeben
User-agent&#58; *
Disallow&#58;
... bevor du so einen Schwachfug verbreitest.
Google umgeht robots.txt

Als ich heute auf Wordpress.com rumsurfte fiel mir der prächtige Pagerank 9 auf und ich vermutete, dass es auch hier einige Möglichkeiten geben könnte Pagerank zu schnorren, natürlich auch aus Eigennutz. Nachdem mir schnell klar war das alle unterseiten einen PR 0 hatten und ich in der robots.txt folgendenen Eintrag fand.

User-agent: IRLbot
Crawl-delay: 3600

User-agent: *
Disallow:

Soweit mir bekann steht (User-agent: *) für alle Crawler jedoch kann man mit (User-agent: Crawler Name) einzelne Crawler von dieser Rolle ausnehmen so wie im obigen Beispiel. Wenn ich jedoch Crawler aussperre inklusive Google etc. Wie kann diese Seite einen Pagerank von 9 haben und der Feed (wordpress.com/feed/) einen Pagerank von 7 ?

oldInternetUser
PostRank 9
PostRank 9
Beiträge: 1250
Registriert: 19.03.2005, 12:52

Beitrag von oldInternetUser » 26.12.2006, 10:44

biatoss hat geschrieben:ganz kurz es geht darum das robots.txt anscheinend nur für inhalt des <body></body> tags gelten.
https://www.biatos.de/google-umgeht-robotstxt.html

wenn ich evtl. in den ansätzen falsch liege bitte kommentieren :) ob hier oder im blog
Also mir wäre das peinlich, wenn ich so einen halbgaren Unsinn unter meinem Namen veröffentlichen würde.

Ich empfehle die freiwillige Löschung.