Rekurencyjny HTML do PDF

12

Mam folder o tej strukturze:

/main-folder
 /index.html
 /subfolder1
    /index1.html
    /file1.html

z wieloma podfolderami i tylko plikami html ... chcę przekonwertować je wszystkie do formatu pdf za pomocą tylko jednego polecenia lub prostego skryptu, który nie wymaga wszystkich nazw plików.

Znasz jedno?

Matteo Pagliazzi
źródło

Odpowiedzi:

15

Sugerowałbym zainstalowanie narzędzia WKHtmlToPDF ze strony http://wkhtmltopdf.org/ (przeniesiono z: http://code.google.com/p/wkhtmltopdf/ ).

Następnie możesz przejść do folderu głównego i przekonwertować je za pomocą find i xargs:

cd /main-folder
find . -name \*.html | sed 's/.html$//g' | xargs -n 1 --replace=X wkhtmltopdf X.html X.pdf

Spowoduje to utworzenie pliku PDF z każdym plikiem HTML.

dan_linder
źródło
rozwiązałem z listą plików i bash dla, ale to jest o wiele lepsze!
Matteo Pagliazzi,
5

Następujące polecenie powinno wykonać zadanie dla jednego łącza:

gnome-web-print http://www.ubuntu.com ubuntu.pdf

W przypadku wielu linków napisanie pętli obsługującej każde łącze jedna po drugiej nie powinno być trudne.

jcollado
źródło