Seite 1 von 1

GSiteCrawler: Meldung "Abgebrochene ULRs...."

Verfasst: 12.07.2008, 06:42
von Cossi
Hallo,

ich habe jetzt zum ersten Mal mit dem GSiteCrawler eine xml-sitemap-Datei erstellt, bekomme aber für 1 Datei folgende Meldung:

"Anzahl abgebrochener URLs in der Warteliste: 1
https://www.praxis-lebenshilfe.de/& verlinkt auf https://www.praxis-lebenshilfe.de/impressum_01.htm"

Insgesamt sieht das so aus:

"Statistiken für praxis-lebenshilfe.de am: 12.07.2008 07:16

Haupt URL: https://www.praxis-lebenshilfe.de/ (Gross-/Kleinschreibung ist relevant)

Anzahl URLs gesamthaft: 57
Anzahl URLs, welche aktiv sind: 57
Anzahl URLs, welche untersucht werden können: 15
Anzahl URLs, die noch in der Warteliste sind: 0 (Einige dieser sind evtl. schon in obiger Aufzählung)
Anzahl abgebrochener URLs in der Warteliste: 1
https://www.praxis-lebenshilfe.de/& verlinkt auf https://www.praxis-lebenshilfe.de/impressum_01.htm
Die 20 ältesten URLs:
https://www.praxis-lebenshilfe.de/sound/0001.mp3 (45 Tage)
https://www.praxis-lebenshilfe.de/image ... alk_01.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/image ... um_01b.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/image ... _gross.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/image ... nlp_01.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/image ... ben_01.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/image ... _klein.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/image ... _klein.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/image ... _klein.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/image ... _klein.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... _r1_c1.gif (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... _r2_c1.gif (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... r2_c11.gif (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... r2_c12.gif (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... r2_c13.gif (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... r2_c14.gif (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... r2_c15.gif (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... _r2_c2.gif (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... _r2_c3.gif (31 Tage)

URLs mit folgenden Texten werden nicht gecrawlt:


Folgende Texte werden aus URLs entfernt:


Folgende Parameter mit Werten werden aus den URLs entfernt:
osCsid
PhpSessId
PhpSessionId
s
Session
SessionId
SID
XTCsid

Die Datei ROBOTS.TXT vom 12.07.2008 07:15:
User-agent: *
Disallow:




Ende der Datei"

[edit]

Folgende Meldung hatte ich noch vergessen:

"Zugriff nicht möglich um 12.07.2008 07:15:
URL: https://www.praxis-lebenshilfe.de/&
Fehler: HTTP-Error 404 Not Found
Link-Ursprung: https://www.praxis-lebenshilfe.de/impressum_01.htm

Zugriff nicht möglich um 12.07.2008 07:18:
URL: https://www.praxis-lebenshilfe.de/&
Fehler: HTTP-Error 404 Not Found
Link-Ursprung: https://www.praxis-lebenshilfe.de/impressum_01.htm"

Kann mir jemand sagen, was das zu bedeuten hat? Die Datei existiert und funktioniert.

Vielen Dank und Gruß, Cossi

Verfasst:
von

Verfasst: 12.07.2008, 10:43
von Elmar2
Das Problem ist das "&" bei

https://www.praxis-lebenshilfe.de/[b]&[/b]

Wo immer dieser Link herkommt, denn im Impressum finde ich ihn nicht. Da müsstest du die mal die Sitemap selbst ansehen und nach diesem Link schauen.

Schlimm ist es übrigens nicht, wenn sich eine nicht vorhandene Adresse in der Sitemap befindet

Verfasst: 12.07.2008, 20:37
von Cossi
Hm... also in der Sitemap selber ist da nichts. Naja, wenn es nichts ausmacht, auch egal... trotzdem vielen Dank..! Cossi