Mam plik PDF, który zawiera zeskanowany obraz dokumentu. Chcę zapisać zawartość tego pliku PDF jako obraz, aby móc go uruchomić za pomocą programu OCR, który akceptuje tylko pliki typu .jpg, .png i .gif.
Jak zapisać / przekonwertować ten plik PDF na jeden z tych formatów obrazu?
EDYCJA: Jednym ze sposobów, w jaki to zrobiłem, jest kliknięcie każdej strony. Skopiuj do schowka. Wklej do Paint.net, a następnie zapisz. Jest to jednak kłopotliwe, ponieważ wydaje się, że można wybrać tylko jedną stronę na raz w programie Acrobat Reader.
%d
pliku wyjściowego to zmienna, która jest zastępowana numerem strony. (Niemal na pewno liczby surowe, nie liczba w pliku PDF.)Zainstaluj Imagemagick . Otwórz okno lub terminal cmd:
Dane wyjściowe to 1 plik jpg dla każdej strony w pliku pdf, test-0.jpg, test-1.jpg itp.
źródło
density
,depth
iquality
flagi, które mogą pomóc zoptymalizować wydajność. Na przykład:convert -density 300 -depth 8 -quality 85 a.pdf a.png
Więcej informacjiJest również
pdfimages
z narzędzi Xpdf (dostępnych na stronie XpdfReader ). Nie przekształci całej strony PDF w obraz, a raczej wyodrębni osadzone obrazy z pliku PDF.Jest to przydatne, jeśli plik PDF zawiera tekst i obrazy, a chcesz tylko obrazy. Ponadto wyodrębni obrazy w ich oryginalnym formacie, więc nie wiąże się to z utratą jakości (w przeciwieństwie do programów, które renderują całą stronę, a następnie przekształcają ją np. W JPEG). W zależności od potrzeb może to być przydatne.
Proste użycie:
Będzie to odczytać pliku wejściowego
mydocument.pdf
, wyodrębnić wszystkie obrazy i zapisywać je do poszczególnych plików o nazwiemydocument-images-0000.jpg
,mydocument-images-0001.jpg
itd.Opcja
-j
umożliwia zapisywanie osadzonych obrazów skompresowanych JPEG jako pliki JPEG, a nie jako pliki PBM / PGM / PPM (które są nieskompresowane i duże). Należy pamiętać, że obrazy mogą być nadal zapisywane jako pliki PBM / PGM / PPM, jeśli w taki sposób zostały zapisane w pliku wejściowym PDF.źródło
pdfimages -j "yourinputfile.pdf" "outputimages"
„outputimages-0000.ppm” (lub „outputimages-0000.jpg”, jeśli mają odpowiedni format). Przykłady .NET można przeszczepić stąd lub tutajMożesz to zrobić za pomocą Adobe Reader:
źródło
Z wyjątkiem odpowiedzi dotyczącej obrazów pdf, wszystkie pozostałe odpowiedzi nie wspominają, że ich rozwiązania faktycznie transkodują osadzone obrazy. Tzn. Te rozwiązania nie tylko wydobywają oryginalny obraz, ale modyfikują go, być może ze szkodą dla obrazu, podczas procesu. Tylko pdfimages wyodrębnia oryginalny obraz. Dotyczy to Ghostscript, Imagemagick, Adobe Reader, PDFFill, PDF Xchange Viewer, OS X Preview i większości innych programów PDF.
źródło
PDFill PDF Tools to prawdopodobnie najłatwiejszy sposób konwersji plików PDF na obrazy w systemie Windows. Pozwoli Ci to wyeksportować wszystkie strony w pliku PDF, aby oddzielić zdjęcia w jednym ujęciu. Posiada również wiele innych funkcji dostępnych za darmo, które są dostępne tylko w innych przeglądarkach PDF, jeśli kupisz wersję komercyjną lub „Pro”.
Użyj przycisku „Konwertuj PDF na obrazy” (przycisk nr 10) na zrzucie ekranu poniżej.
Jeśli chcesz połączyć obrazy w jeden bardzo wysoki obraz, aby wystarczyło tylko podać jeden plik do programu OCR, możesz użyć IrfanView
źródło
Ponieważ nie podałeś tagu OS, dołączę odpowiedź OSX:
Pliki PDF domyślnie otwierają się w Preview.app, który pozwala na użycie
File -> Save-As
:źródło
Również PDF Xchange Viewer (bezpłatny) wykona eksport do pliku. Plik → Eksportuj → Eksportuj do obrazu.
Nie tylko to, ale uważam, że jest to najlepsza darmowa przeglądarka plików PDF dla systemu Windows i ma kilka fajnych funkcji znaczników. Mam licencję na Adobe Acrobat i nadal wolę to, chyba że robię obszerną edycję, co rzadko się zdarza.
źródło
(Non-free) Acrobat Professional robi to:
Zaawansowane-> Przetwarzanie dokumentów-> Eksportuj wszystkie obrazy ...
źródło
Jeśli plik ma mniej niż 5 MB i nie martwisz się o prywatność / poufność, to przydatna usługa online pod adresem http://www.go2convert.com/, która może wykonać wiele konwersji graficznych (w tym pdf na JPEG)
źródło
Jeśli obraz przekracza rozmiar ekranu, możesz użyć FastStone Capture (funkcja „Capture Scrolling Window”) i zapisać obraz jako JPEG.
źródło
Możesz sprawdzić ten artykuł .
Wymienia 6 różnych sposobów konwersji pdf na obrazy.
Konwertuj PDF na JPG (The Web Way)
Konwertery plików PDF na JPG dla komputerów stacjonarnych
źródło