Du befindest Dich im Archiv vom ABAKUS Online Marketing Forum. Hier kannst Du Dich für das Forum mit den aktuellen Beiträgen registrieren.

Google indiziert seite nicht

Ajax, Hijax, Microformats, RDF, Markup, HTML, PHP, CSS, MySQL, htaccess, robots.txt, CGI, Java, Javascript usw.
Neues Thema Antworten
Dude
PostRank 1
PostRank 1
Beiträge: 4
Registriert: 28.10.2003, 08:21

Beitrag von Dude » 28.10.2003, 08:24

hi,

ip adresse - - [datum etc +0100] "GET /robots.txt HTTP/1.0" 404 1503 "-" "Googlebot/2.1 (+https://www.googlebot.com/bot.html)"
ip adresse - - [datum etc+0100] "GET / HTTP/1.0" 200 24362 "-" "Googlebot/2.1 (+https://www.googlebot.com/bot.html)"


das war ein eintrag aus den logfiles. google indiziert irgendwie nur die startseite meiner hp, obwohl die weiterführenden links mit mod rewrite geschrieben sind und ne normale html endung haben. die dateinamen sind so aufgebaut, dass sie einfach nur aus einer zahl bestehen. eine robots.txt datei gibt es nicht auf dem server.

mittlerweile hat google sogar die neuen mod rewrite-seiten wieder rausgeworfen (!) und behält jetzt nur noch die alten seiten mit parameterübergaben (irgendwas.php?id=1) !!! woran kann das liegen?

Anzeige von ABAKUS

von Anzeige von ABAKUS »


Hochwertiger Linkaufbau bei ABAKUS:
  • Google-konformer Linkaufbau
  • nachhaltiges Ranking
  • Linkbuilding Angebote zu fairen Preisen
  • internationale Backlinks
Wir bieten Beratung und Umsetzung.
Jetzt anfragen: 0511 / 300325-0

viggen
PostRank 10
PostRank 10
Beiträge: 6249
Registriert: 12.05.2003, 14:44

Beitrag von viggen » 28.10.2003, 11:55

Hello Dude,

Du hast keine Robots.txt deswegen eine 404 Meldung. Mit der robots.txt kannst du auch steuern das Google nicht die php?id=xxx anzeigt sondern die anderen. (wie meistens bei Google, Geduld ist angesagt)

Dude
PostRank 1
PostRank 1
Beiträge: 4
Registriert: 28.10.2003, 08:21

Beitrag von Dude » 28.10.2003, 12:16

Aber sollte google nicht auch ohne eine robots.txt die seite weiter indizieren? außerdem gibt es ja noch den eintrag

<meta name="robots" content="index,follow" />

dass er allen links folgen soll. kurzzeitig hat google ja auch mod-rewrite-html seiten aufgenommen, diese aber wieder rausgeworfen!

Anzeige von ABAKUS

von Anzeige von ABAKUS »

Content Erstellung von ABAKUS Internet Marketing
Ihre Vorteile:
  • einzigartige Texte
  • suchmaschinenoptimierte Inhalte
  • eine sinnvolle Content-Strategie
  • Beratung und Umsetzung
Jetzt anfragen: 0511 / 300325-0

viggen
PostRank 10
PostRank 10
Beiträge: 6249
Registriert: 12.05.2003, 14:44

Beitrag von viggen » 28.10.2003, 12:19

Schon, aber Google sucht erst die robots.txt, du hast aber keine deswegen der 404 Fehler.

robots.txt würde ich auf jeden fall einbauen da mann damit schön die bots (die darauf achten) herumkommandieren kann)


vielleicht hat google die mod rewrite wieder rausgenommen da die alte Version auch da war und eventuell als duplicate content gewertet wurde.

mfg
viggen

Dude
PostRank 1
PostRank 1
Beiträge: 4
Registriert: 28.10.2003, 08:21

Beitrag von Dude » 28.10.2003, 14:03

wie krieg ich das dann hin, dass google nur die mod rewrite - htmlseiten und nich die phpseiten aufnimmt?

auer
PostRank 5
PostRank 5
Beiträge: 218
Registriert: 30.10.2003, 19:19

Beitrag von auer » 02.11.2003, 10:29

Bau dir eine robots.txt, die bsp. mit
Disallow: /freeware-tools/*.xml$
Disallow: /freeware-tools/*.config$
alle Dateien mit der Endung .xml bzw. .config im Verzeichnis /freeware-tools/ ausschließt.

Google hatte bei mir am Montag das obige Unterverzeichnis neu eingelesen, am Dienstag waren die Dateien gelistet, u.a. Xml-Dateien, bei denen eine Indizierung Quatsch war und die Html-Umwandlung eine leere Seite angezeigt hat - ich hatte nicht daran gedacht, daß diese eingelesen werden. Am Dienstag abend habe ich die robots.txt entsprechend geändert, google holte sich diese am Mittwoch früh, morgens waren alle neu aufgenommenen Seiten wieder draußen. Freitags wurden alle .html-Seiten und eine .xml-Seite aus einem anderen Verzeichnis beabsichtigt eingelesen, alle von der obigen Anweisung erfaßten Dateien säuberlich ignoriert. Nun - Sonntag früh - sind alle Dateien wieder indiziert. M.a.W.: Es geht genau so, wie es soll.

[Edit] Gemeint war natürlich: Oben dein auszuschließendes Verzeichnis und /Verzeichnisname/*.php$ zu verwenden. Das, was ich geschrieben habe, ist eben ein Ausschnitt meiner robots.txt

------------
Gruß, Jürgen Auer

Antworten
  • Vergleichbare Themen
    Antworten
    Zugriffe
    Letzter Beitrag