W jaki sposób (pobierać i) konwertować struktury HTML na EPUB (lub inny format odpowiedni dla czytnika Sony PRS-505)?
Moje pytanie nie dotyczy tego, jak przekonwertować pojedynczy plik HTML na plik EPUB, ponieważ jest to łatwe; mam na myśli, że mam kilka książek, które chcę przeczytać na moim Sony PRS-505 i te książki są najczęściej online w formacie HTML, ale z wieloma połączonymi stronami i jest jedna strona z listą treści, jak ten przykład http: / /www.edge.org/documents/ThirdCulture/d-Contents.html
... lub czasem jest to trochę bardziej skomplikowane, ponieważ lista treści zawiera tylko rozdziały, a wewnątrz rozdziałów znajdują się linki do podrozdziałów, jak w tym przykładzie: http: SLASHSLASHwww.hyw.com/Books/WargamesHandbook/ Contents.htm (mogę teraz opublikować tylko 1 hiperłącze b / c ograniczenia użytkownika, dlatego właśnie zamiast tego jest SLASHSLASH
Chcę przekonwertować te przykłady i kilka innych, z poprawnymi rozdziałami, obrazami i akceptowalnym formatowaniem itp., Więc w zasadzie chcę stworzyć odpowiedni ebook z drzewa HTML.
Jaki jest najłatwiejszy sposób?
Odpowiedzi:
Korzystam z wget, aby rekurencyjnie pobierać strony internetowe (zwykle podręczniki html online), a potem, gdy mam już wszystko w folderze, przekonwertowałem do wybranego przeze mnie formatu za pomocą Calibre .
źródło