GSiteCrawler: Meldung "Abgebrochene ULRs...."
Verfasst: 12.07.2008, 06:42
Hallo,
ich habe jetzt zum ersten Mal mit dem GSiteCrawler eine xml-sitemap-Datei erstellt, bekomme aber für 1 Datei folgende Meldung:
"Anzahl abgebrochener URLs in der Warteliste: 1
https://www.praxis-lebenshilfe.de/& verlinkt auf https://www.praxis-lebenshilfe.de/impressum_01.htm"
Insgesamt sieht das so aus:
"Statistiken für praxis-lebenshilfe.de am: 12.07.2008 07:16
Haupt URL: https://www.praxis-lebenshilfe.de/ (Gross-/Kleinschreibung ist relevant)
Anzahl URLs gesamthaft: 57
Anzahl URLs, welche aktiv sind: 57
Anzahl URLs, welche untersucht werden können: 15
Anzahl URLs, die noch in der Warteliste sind: 0 (Einige dieser sind evtl. schon in obiger Aufzählung)
Anzahl abgebrochener URLs in der Warteliste: 1
https://www.praxis-lebenshilfe.de/& verlinkt auf https://www.praxis-lebenshilfe.de/impressum_01.htm
Die 20 ältesten URLs:
https://www.praxis-lebenshilfe.de/sound/0001.mp3 (45 Tage)
https://www.praxis-lebenshilfe.de/image ... alk_01.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/image ... um_01b.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/image ... _gross.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/image ... nlp_01.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/image ... ben_01.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/image ... _klein.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/image ... _klein.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/image ... _klein.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/image ... _klein.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... _r1_c1.gif (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... _r2_c1.gif (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... r2_c11.gif (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... r2_c12.gif (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... r2_c13.gif (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... r2_c14.gif (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... r2_c15.gif (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... _r2_c2.gif (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... _r2_c3.gif (31 Tage)
URLs mit folgenden Texten werden nicht gecrawlt:
Folgende Texte werden aus URLs entfernt:
Folgende Parameter mit Werten werden aus den URLs entfernt:
osCsid
PhpSessId
PhpSessionId
s
Session
SessionId
SID
XTCsid
Die Datei ROBOTS.TXT vom 12.07.2008 07:15:
User-agent: *
Disallow:
Ende der Datei"
[edit]
Folgende Meldung hatte ich noch vergessen:
"Zugriff nicht möglich um 12.07.2008 07:15:
URL: https://www.praxis-lebenshilfe.de/&
Fehler: HTTP-Error 404 Not Found
Link-Ursprung: https://www.praxis-lebenshilfe.de/impressum_01.htm
Zugriff nicht möglich um 12.07.2008 07:18:
URL: https://www.praxis-lebenshilfe.de/&
Fehler: HTTP-Error 404 Not Found
Link-Ursprung: https://www.praxis-lebenshilfe.de/impressum_01.htm"
Kann mir jemand sagen, was das zu bedeuten hat? Die Datei existiert und funktioniert.
Vielen Dank und Gruß, Cossi
ich habe jetzt zum ersten Mal mit dem GSiteCrawler eine xml-sitemap-Datei erstellt, bekomme aber für 1 Datei folgende Meldung:
"Anzahl abgebrochener URLs in der Warteliste: 1
https://www.praxis-lebenshilfe.de/& verlinkt auf https://www.praxis-lebenshilfe.de/impressum_01.htm"
Insgesamt sieht das so aus:
"Statistiken für praxis-lebenshilfe.de am: 12.07.2008 07:16
Haupt URL: https://www.praxis-lebenshilfe.de/ (Gross-/Kleinschreibung ist relevant)
Anzahl URLs gesamthaft: 57
Anzahl URLs, welche aktiv sind: 57
Anzahl URLs, welche untersucht werden können: 15
Anzahl URLs, die noch in der Warteliste sind: 0 (Einige dieser sind evtl. schon in obiger Aufzählung)
Anzahl abgebrochener URLs in der Warteliste: 1
https://www.praxis-lebenshilfe.de/& verlinkt auf https://www.praxis-lebenshilfe.de/impressum_01.htm
Die 20 ältesten URLs:
https://www.praxis-lebenshilfe.de/sound/0001.mp3 (45 Tage)
https://www.praxis-lebenshilfe.de/image ... alk_01.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/image ... um_01b.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/image ... _gross.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/image ... nlp_01.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/image ... ben_01.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/image ... _klein.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/image ... _klein.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/image ... _klein.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/image ... _klein.jpg (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... _r1_c1.gif (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... _r2_c1.gif (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... r2_c11.gif (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... r2_c12.gif (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... r2_c13.gif (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... r2_c14.gif (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... r2_c15.gif (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... _r2_c2.gif (31 Tage)
https://www.praxis-lebenshilfe.de/img_n ... _r2_c3.gif (31 Tage)
URLs mit folgenden Texten werden nicht gecrawlt:
Folgende Texte werden aus URLs entfernt:
Folgende Parameter mit Werten werden aus den URLs entfernt:
osCsid
PhpSessId
PhpSessionId
s
Session
SessionId
SID
XTCsid
Die Datei ROBOTS.TXT vom 12.07.2008 07:15:
User-agent: *
Disallow:
Ende der Datei"
[edit]
Folgende Meldung hatte ich noch vergessen:
"Zugriff nicht möglich um 12.07.2008 07:15:
URL: https://www.praxis-lebenshilfe.de/&
Fehler: HTTP-Error 404 Not Found
Link-Ursprung: https://www.praxis-lebenshilfe.de/impressum_01.htm
Zugriff nicht möglich um 12.07.2008 07:18:
URL: https://www.praxis-lebenshilfe.de/&
Fehler: HTTP-Error 404 Not Found
Link-Ursprung: https://www.praxis-lebenshilfe.de/impressum_01.htm"
Kann mir jemand sagen, was das zu bedeuten hat? Die Datei existiert und funktioniert.
Vielen Dank und Gruß, Cossi