Seite 1 von 1
Google indiziert seite nicht
Verfasst: 28.10.2003, 08:24
von Dude
hi,
ip adresse - - [datum etc +0100] "GET /robots.txt HTTP/1.0" 404 1503 "-" "Googlebot/2.1 (+
https://www.googlebot.com/bot.html)"
ip adresse - - [datum etc+0100] "GET / HTTP/1.0" 200 24362 "-" "Googlebot/2.1 (+
https://www.googlebot.com/bot.html)"
das war ein eintrag aus den logfiles. google indiziert irgendwie nur die startseite meiner hp, obwohl die weiterführenden links mit mod rewrite geschrieben sind und ne normale html endung haben. die dateinamen sind so aufgebaut, dass sie einfach nur aus einer zahl bestehen. eine robots.txt datei gibt es nicht auf dem server.
mittlerweile hat google sogar die neuen mod rewrite-seiten wieder rausgeworfen (!) und behält jetzt nur noch die alten seiten mit parameterübergaben (irgendwas.php?id=1) !!! woran kann das liegen?
Verfasst:
von
Hochwertiger Linkaufbau bei ABAKUS:
- Google-konformer Linkaufbau
- nachhaltiges Ranking
- Linkbuilding Angebote zu fairen Preisen
- internationale Backlinks
Wir bieten
Beratung und
Umsetzung.
Jetzt anfragen:
0511 / 300325-0
Verfasst: 28.10.2003, 11:55
von viggen
Hello Dude,
Du hast keine Robots.txt deswegen eine 404 Meldung. Mit der robots.txt kannst du auch steuern das Google nicht die php?id=xxx anzeigt sondern die anderen. (wie meistens bei Google, Geduld ist angesagt)
mmmmhhh
Verfasst: 28.10.2003, 12:16
von Dude
Aber sollte google nicht auch ohne eine robots.txt die seite weiter indizieren? außerdem gibt es ja noch den eintrag
<meta name="robots" content="index,follow" />
dass er allen links folgen soll. kurzzeitig hat google ja auch mod-rewrite-html seiten aufgenommen, diese aber wieder rausgeworfen!
Verfasst:
von
Content Erstellung von
ABAKUS Internet Marketing
Ihre Vorteile:
- einzigartige Texte
- suchmaschinenoptimierte Inhalte
- eine sinnvolle Content-Strategie
- Beratung und Umsetzung
Jetzt anfragen:
0511 / 300325-0
Verfasst: 28.10.2003, 12:19
von viggen
Schon, aber Google sucht erst die robots.txt, du hast aber keine deswegen der 404 Fehler.
robots.txt würde ich auf jeden fall einbauen da mann damit schön die bots (die darauf achten) herumkommandieren kann)
vielleicht hat google die mod rewrite wieder rausgenommen da die alte Version auch da war und eventuell als duplicate content gewertet wurde.
mfg
viggen
Verfasst: 28.10.2003, 14:03
von Dude
wie krieg ich das dann hin, dass google nur die mod rewrite - htmlseiten und nich die phpseiten aufnimmt?
Verfasst: 02.11.2003, 10:29
von auer
Bau dir eine robots.txt, die bsp. mit
Disallow: /freeware-tools/*.xml$
Disallow: /freeware-tools/*.config$
alle Dateien mit der Endung .xml bzw. .config im Verzeichnis /freeware-tools/ ausschließt.
Google hatte bei mir am Montag das obige Unterverzeichnis neu eingelesen, am Dienstag waren die Dateien gelistet, u.a. Xml-Dateien, bei denen eine Indizierung Quatsch war und die Html-Umwandlung eine leere Seite angezeigt hat - ich hatte nicht daran gedacht, daß diese eingelesen werden. Am Dienstag abend habe ich die robots.txt entsprechend geändert, google holte sich diese am Mittwoch früh, morgens waren alle neu aufgenommenen Seiten wieder draußen. Freitags wurden alle .html-Seiten und eine .xml-Seite aus einem anderen Verzeichnis beabsichtigt eingelesen, alle von der obigen Anweisung erfaßten Dateien säuberlich ignoriert. Nun - Sonntag früh - sind alle Dateien wieder indiziert. M.a.W.: Es geht genau so, wie es soll.
[Edit] Gemeint war natürlich: Oben dein auszuschließendes Verzeichnis und /Verzeichnisname/*.php$ zu verwenden. Das, was ich geschrieben habe, ist eben ein Ausschnitt meiner robots.txt
------------
Gruß, Jürgen Auer