Szukam sposobu na konwersję strony do formatu PDF, ale zachowując wygląd strony. Zachowanie tekstu strony internetowej (do wyboru), możliwość przeszukiwania [Generowanie zrzutu obrazu strony internetowej uniemożliwiłoby wybranie tekstu lub przeszukiwanie].
Szukam drukowania strony internetowej w formacie PDF, tak jak jest w przeglądarce internetowej, bez manipulacji stylem lub wyrównaniem, ani utraty statycznych komponentów strony.
Pomogłoby to zachować kopie stron internetowych w trybie offline, które są łatwe do odczytania, opisywania i przeszukiwania.
Nie musisz czytać żadnego z poniższych (pytanie to tylko powyższa sekcja) aby uzyskać moje pytanie. Poniższa sekcja zawiera listę tego, co udało mi się uzyskać dzięki badaniom lub odpowiedziom innych osób w sposób zagnieżdżony, aby uzyskać odpowiedź na pytanie.
Wyniki badań (sugestie, które nie rozwiązały mojego problemu)
Dotychczasowe wyniki prób znalezienia rozwiązania (wszystkie nadal nie działają jako rozwiązanie tego pytania)
Wypróbowałem te mechanizmy drukowania stron internetowych w formacie PDF, ale wszystkie manipulują wyglądem stron, nawet bardziej szkodliwie i sprawiają, że niektóre z nich są mało czytelne: Przykładowa strona zrzuty ekranu są zawarte w nawiasach kwadratowych)
- Chrome [ Oryginalny , Drukuj style ( Wyłączone | nie wyłączone )]
- Firefox [ Oryginalny , Drukuj style (wyłączone p1 , p2 | nie wyłączone p1 , p2 )]
- Czytelność
- Upraszcza stronę (co jest dobrą rzeczą w przypadku czytania skoncentrowanego - nie jest to jednak to, czego szukam). Szukam zachowywania wszystkich właściwości pozycji / stylów strony, tak jak jest to widoczne w przeglądarce internetowej, w formacie PDF bez żadnych manipulacji.
- Czytnik Foxit
- NovaPDF
- CutyCapt [ Oryginalny , Współczynnik powiększenia: 0,4 : Screenshots, Outputted PDF]
- Dodam linki po rozwiązaniu problemów z uruchomieniem programu w systemie Windows ”
- wkhtmltopdf [ Oryginalny , Współczynnik powiększenia: 0,4 : Zrzuty ekranu , Wydany PDF ]
- Nie obsługuje CSS3.
Wszystkie wtyczki do przechwytywania obrazu strony internetowej (np. Uprowadzenie , Niesamowity zrzut ekranu , Fireshot , Firefox Screenshot Developer Tool , Pełny zrzut ekranu , Page2Obrazy , przechwytywanie stron internetowych , ...) nie odpowiadaj na moje pytanie, bo tak nie jest zachowaj tekst i linki .
Scrible jest świetny w zachowaniu stron internetowych, tak jak w przypadku dalszych adnotacji i badań, ale niestety nadal w trybie online i bez konwersji do formatu PDF.
Istnieją dwa inne pytania dotyczące społeczności podobne do moich, ale to jest trochę inne, ale z tymi ważnymi różnicami
- Jak uzyskać WYSIWYP (wydrukuj to, co widzisz) w przeglądarce internetowej?
- To pytanie pyta o sposób przechwycenia strony internetowej (tak jak widać na ekranie), nawet jeśli jest to obraz i tekst nie zostanie zachowany. Podczas gdy szukam przechwytywania tekstu i linków ( ważne jest zachowanie tekstu i linków ).
Więcej podobnych pytań gdzie zachowanie tekstu i linków nie jest wymagane (strony są przechwytywane jako zrzuty obrazu przeważnie):
- Drukuj z przeglądarki za pomocą ekranu CSS?
- Pyta o wyłączenie stylów drukowania, co wydaje się nie pomagać z powyższych zrzutów ekranu.
Uwagi
OS: Windows 10
Odpowiedzi:
W projekcie uniwersyteckim napotkaliśmy ten sam problem i byliśmy w stanie go rozwiązać
wkhtmltopdf
Całkiem podobały nam się możliwości tego narzędzia w linii poleceń. Nazwaliśmy to również za pomocą kodu Pythona, aby zrenderować bieżący stan stron internetowych. Ma możliwość dostarczenia strony internetowej w formacie pdf, zwykle nie jest to idealne rozwiązanie, aby zachować widok strony ze względu na formatowanie strony (na przykład A4) lub png (zachowuje widok strony, ale nie linki)
Stosujemy również projekt czytelności (dla Pythona: pypi.python.org/pypi/readability-lxml), który całkiem dobrze usuwa reklamy i ich wykrywanie (np. Artykuły prasowe i tym podobne). Jeśli chcesz tylko dodatek lub rozszerzenie dla swojej przeglądarki, poniższa implementacja czytelności może zaspokoić twoją potrzebę:
https://www.readability.com/addons/
źródło
Jeśli używasz Linuksa, wypróbuj to małe narzędzie wiersza poleceń CutyCapt , która zależy tylko od Qt i QtWebkit oraz eksportuje do PDF.
źródło
Miałem ten sam problem i zrozumiałem go za pomocą Chrome i sterownika drukarki o nazwie PDF995, który pobrałem bezpiecznie i za darmo (jednym linkiem do pobrania jest https://pdf995.en.softonic.com/ inny jest http://downloads.tomsguide.com/pdf995,0301-829.html ).
Myślę jednak, że wystarczy każda przeglądarka internetowa i dowolny konwerter plików PDF. W każdym razie oto co zrobiłem:
Kliknij prawym przyciskiem myszy zaznaczony wybór lub naciśnij Ctrl + P (obie opcje dają nieco inne wyniki, ale po zakończeniu uzyskasz taki sam wynik).
Jeśli klikniesz prawym przyciskiem myszy na 2., zaznaczenie (skrót), kliknij „drukuj” i tylko wszystkie wybrane elementy będą widoczne na podglądzie wydruku. Upewnij się, że zmieniłeś miejsce docelowe drukarki na dowolny konwerter PDF, którego zdecydujesz się użyć (PDF995 lub inny).
Kliknij „drukuj” i zapisze się jako dokument pdf.
Jeśli naciśniesz Ctrl + P w 2. (nieco dłuższy sposób), kliknij „Więcej ustawień” i przewiń w dół do „Opcje”.
Kliknij pole „Tylko wybór”, a wszystko, co opisałem w skrócie, nastąpi.
Nie zapomnij zmienić miejsca docelowego drukarki na dowolny konwerter PDF (PDF995 lub inny).
Kliknij „drukuj”.
źródło
Chociaż nie jest to dokładnie twoja prośba, ale nie w formacie PDF, jeśli celem jest wyłącznie przechowywanie kopii stron internetowych w trybie offline w celu późniejszego przejrzenia, zapisanie ich jako strony internetowej właśnie to zrobiłoby.
Wielkie zastrzeżenie polega na tym, że utworzy plik .html i folder zawierający całą zawartość multimedialną na stronie, a nie pojedynczy dokument.
W Chrome i Firefox możesz zapisać stronę, klikając ją prawym przyciskiem myszy i wybierając Zapisz jako ... W Internet Explorerze możesz zapisać go w Plik - & gt; Zapisz jako (naciśnięcie klawisza Alt powoduje wyświetlenie menu).
źródło
Wypróbuj tę usługę. Tworzy plik PDF ze strony internetowej, tak jak widzisz go w przeglądarce. https://lomotoh.com/ (Jestem związany z tą stroną)
źródło
Co najmniej cały tekst na niektórych stronach można przeszukiwać, wybierać, wycinać i wklejać. Próbowałem na stronie wklejonej automatycznie przez komputer z tekstem i pikselami, a to wszystko nastroiło na obraz.
Używam tych rzeczy od lat. Najlepsze wyniki osiągam w Linuksie, przebudowując stronę w wybranym przez Ciebie słowie XX i eksportując wynik w formacie PDF. Mogę uzyskać to, czego chcę, za znaczną cenę. Z mojego ograniczonego użytku łuk ivin Witryna David Herse rozstawiona https://lomotoh.com/ (Jestem NIE związany z tą stroną) działa tak dobrze jak każdy, z którego kiedykolwiek korzystałem. Będę chodził do zasobów, aby pokryć strony internetowe do plików PDF, dopóki nie znajdę lepszego lub nie będzie to kosztowało zbyt wiele, aby zapłacić z własnej cienkiej portmonetki.
źródło