Chcę pobrać HTML (przykład: http://www.brpreiss.com/books/opus6/ ) i dołączyć go do jednego HTML lub innego formatu, którego mogę używać w czytniku ebooków. Witryny z bezpłatnymi książkami nie mają standardowego stronicowania, nie są blogami ani forami, więc nie wiem, jak wykonać automatyczne indeksowanie i scalanie.
ebook
web-crawler
Hrvoje Hudo
źródło
źródło
Kiedyś to robiłem, to Calibre.
To jednak stało się zbyt uciążliwe, więc zbudowałem rozszerzenie Chrome, aby było łatwiej.
Nazywa się EpubPress ( http://epub.press ).
Pozwala zbudować ebooka z kart Chrome.
Mam nadzieję, że to pomaga!
źródło
Pandoc może pobrać link do strony (lub pliku HTML) i przekonwertować go na pdf / epub ...
Nie jestem pewien, czy się czołgał. Jeśli tak się nie stanie, możesz najpierw zaindeksować strony za pomocą wget lub czegoś (lub po prostu zebrać linki) i przekazać go pandocowi.
źródło
Możesz użyć https://getpocket.com i kieszonkowego przepisu kalibru dostępnego poprzez menu „Pobierz wiadomości”.
źródło
HTTrack to dobra opcja - zbuduje ebooka ze strony internetowej: jest dostępny do pobrania stąd: https://www.httrack.com/ HTTrack "pozwala pobrać witrynę sieci Web z Internetu do lokalnego katalog, budowanie rekurencyjnie wszystkich katalogów, pobieranie HTML, obrazów i innych plików z serwera na komputer. HTTrack organizuje względną strukturę linków oryginalnej strony. "
Następnie możesz przekonwertować HTML na EPUB, AZW3 lub PDF za pomocą Calibre lub innego oprogramowania do konwersji HTML na epub.
Drugą opcją konwersji bezpośrednio do EPUB jest EpubPress: Ma rozszerzenia umożliwiające korzystanie z przeglądarki Firefox (tylko v44.0 +) lub Chrome. Aby korzystać z tego oprogramowania, musisz otworzyć okno przeglądarki. Każda karta jest zasadniczo „rozdziałem” w twoim ebooku. Ułóż zakładki w żądanej kolejności wyglądu, a następnie aktywuj epubpress - pobierze i ułoży zakładki w kolejności ich wyświetlania, w formacie .epub. Mam nadzieję że to pomoże!
* Należy jednak pamiętać, że EpubPress pobiera odrębne strony internetowe - nie „strony internetowe”, jak robi to HTTrack. Aby pobrać witrynę za pomocą EpubPress, musisz otworzyć każdy link na stronie jako osobną kartę, a następnie użyć Epubpress do zebrania tych linków do formatu .epub.
źródło