GSiteCrawler erstellt auch HTML-Sitemaps, allerdings sind die sehr einfach gehalten. Du kannst dir das Programm ja mal angucken. Vielleicht reicht es ja für deine Zwecke.
Da ist ein kleiner Ansatz wie man ein Titel der Seiten abfragt, damit kannst du z.b. alle Webseiten mit eine Php Script besuchen und die Titel abfragen und deine Sitemap wieder zusammen bauen.