Istnieje wiele sposobów konwersji strony internetowej na format PDF (usługi online, bookmarklety, rozwiązania Print to PDF itp.).
Ale żaden z nich nie daje pliku PDF z możliwością przeszukiwania. Wygląda na to, że wszystkie konwertują HTML na jeden gigantyczny obraz. Czy istnieje możliwość przekonwertowania strony internetowej na plik PDF z możliwością wyszukiwania?
windows-7
pdf
print-to-pdf
AngryHacker
źródło
źródło
Odpowiedzi:
Znalazłem projekt wkhtmltopdf , który wydaje się załatwić sprawę . To linia poleceń, więc jest trochę krzywej uczenia się, ale nie jest tak źle.
Aby przekonwertować stronę internetową, otwórz okno poleceń w katalogu, w którym
wkhtmltopdf
został zainstalowany, i wykonaj następujące czynności:Aplikacja ma absurdalnie wiele opcji dostosowanych do potrzeb, ale ustawienia domyślne dają całkiem niezły wynik.
źródło
Program CutePDF korzysta z GhostScript do przetwarzania tekstu, a następnie ps2pdf do tworzenia przeszukiwalnych plików PDF stron internetowych. To oczywiście nie zadziała, jeśli tekst na stronie jest obrazem na początek.
źródło
Jaki jest problem z rozwiązaniami Print to PDF? Mam dwa wirtualne drukarki zainstalowane w moim systemie: PDF Creator i Virtual Printer od Adobe Acrobat X. Oba działają dobrze. Mogę łatwo wyszukiwać tekst w wygenerowanych plikach PDF, o ile moja przeglądarka plików PDF ma funkcje OCR (co jest obecnie powszechne).
Jeśli myślisz o utworzeniu czegoś takiego jak dokument tekstowy i słowny, nie możesz tego zrobić. Ogranicza format PDF lub mówi, jak działa format PDF. Z tego powodu możemy osadzać czcionki itp. W tym formacie bez żadnej zależności, aby był uniwersalny.
I nie sądzę, że projekt wkhtmltopdf może wygenerować plik PDF, w którym można wyszukiwać tekst bez korzystania z technologii OCR (ponieważ narusza specyfikację PDF).
źródło
Używam Adobe Acrobat 8 Professional (aktualna wersja to Adobe Acrobat X ). Ma opcję menu,
File... Create PDF... From Web Page...
która prosi mnie o adres URL, a następnie pobiera stronę pod adresem URL jako plik PDF z tekstem do przeszukiwania. Przekształci również rekurencyjnie strony, do których prowadzą linki z tej strony. Można skończyć z wieloma stronami HTML w jednym wielostronicowym pliku PDF, z zachowanymi łączami między stronami.W przypadku niektórych stron internetowych program Acrobat Create PDF źle formatuje. W takim przypadku wracam do
Adobe PDF 8.0
sterownika drukarki zainstalowanego w moim systemie Acrobat 8 Professional. Bardzo dobrze daje mi PDF w postaci odpowiednika strony internetowej, na którą patrzę, z tekstem do przeszukiwania.Adobe Acrobat 8 Professional nie jest wolnym oprogramowaniem. Jest to oprogramowanie prawnie zastrzeżone. Jednak IMHO zasługuje na tyle samo miejsca na komputerze każdego pracownika wiedzy, co Microsoft Office. I nie określiłeś, że nalegałeś na darmowy program do konwersji strony internetowej na PDF z możliwością wyszukiwania.
źródło
To całkiem dobre narzędzie, które konwertuje strony internetowe na pliki PDF z możliwością wyszukiwania: http://kitpdf.com/web_to_pdf/ . Spróbuj i sprawdź, czy spełnia twoje potrzeby.
źródło
Właśnie wydrukowałem tę stronę w Google Chrome i zapisałem ją jako plik pdf. Nie mam problemów z używaniem wyszukiwania w drukowanym pliku pdf. Dane wyjściowe mogą się różnić w zależności od typu strony, jeśli strona zawiera ramki flash - najprawdopodobniej nie będzie można tam szukać treści.
źródło
GrabzIt może konwertować strony internetowe na w pełni przeszukiwalne pliki PDF. Ponadto zapewniają bezpłatne narzędzie do planowania zadań online , co oznacza, że kodowanie nie jest wymagane.
źródło
PrimoPDF! To jest darmowe. Działa idealnie i może zamienić wszystko, co można wydrukować, w plik PDF (z możliwością wyszukiwania). Działa, dodając się jako nowa drukarka. Łatwy również do odinstalowania.
Mam nadzieję że to pomoże.
źródło