Mam problem z tym, że niektórzy użytkownicy tworzą bardzo duże pliki PDF. Z drugiej strony mam pliki PDF wysłane z naszych faksów, które są naprawdę małe i całkowicie do wydruku. Moje pytanie brzmi
- Czy jest jakiś sposób na znalezienie rozdzielczości (DPI) pliku PDF. Przeszukuję internet, nie mogę znaleźć odpowiedzi. Sprawdziłem właściwości pliku, ta informacja nie była tam przechowywana, przynajmniej w moim przypadku.
- Jaka jest optymalna rozdzielczość konwersji pliku tekstowego na obraz PDF? 96dpi, 300dpi lub więcej?
- Zabawne pytanie. Czy mogę zmienić rozmiar pliku PDF, który został zeskanowany przy wysokiej rozdzielczości na mniejszą?
Wiem, że niektóre odpowiedzi mogą być niedostępne, ponieważ przeszukałem już Internet i nie mogłem znaleźć odpowiedzi.
Uwaga: Mój plik PDF to w całości obrazy, tekst na obrazy. Znam również primoPDF (za darmo) coś, z czym możesz eksperymentować
pdf
images
resolution
dpi
hk_
źródło
źródło
Wiem, że nie chcesz wyodrębniać danych obrazu, ale jest to prawdopodobnie jedyny sposób na znalezienie oryginalnej rozdzielczości.
W * nix, jeśli masz zainstalowane ImageMagick's
identify
i Xpdf 1 :Gdzie
test.pdf
jest twój wejściowy plik PDF. Pliki wyjściowe są zapisywane wtest-000.jpg
,test-001.jpg
itd. Dałoby to oryginalny rozmiar wszystkich zawartych obrazów tego pliku PDF 2 .Przykładowe dane wyjściowe dla pliku PDF zawierającego tylko jeden duży obraz:
1) Windows też je ma, ale skrypt byłby oczywiście inny.
2) Należy pamiętać, że obrazy tak naprawdę nie zawierają informacji DPI. Mówiąc wprost: jest to po prostu coś używanego do drukowania, a obrazy nie potrzebują nieodłącznej miary DPI.
Zasadniczo wszystko, co chcesz wydrukować, powinno mieć rozdzielczość 300 dpi lub więcej. Większość drukarek będzie również obsługiwać wyższą rozdzielczość.
źródło
pdfimages -list test.pdf
. Zamiast wyświetlać pliki, podaje rozmiar i typ obrazu. Nadal nie zapewnia wyraźnej rozdzielczości, ale unika tworzenia plików wyjściowych.pdfimages -list
zawiera wyraźnex-ppi
iy-ppi
, jak również wiele innych informacji.pdfimages
może być całkiem zła (np. gdy obraz jest większy niż jego widoczny obszar, w pliku PDF wyprodukowanym przezscribus
). (Niestety tak naprawdę nie mam teraz czasu na zgłoszenie błędu).Z jakiegoś powodu najnowszą wersją pdfimages, którą mogę zaktualizować w moim CentOS, jest wersja 3.04.
Nie mam więc opcji -list, jak stwierdzono w poprzednich odpowiedziach. Jednak obraz testowy utworzony z pdfimages na podstawie odpowiedzi slhck zawiera pożądaną odpowiedź!
identyfikacja -verbose test-0000.jpg | więcej
Dlatego dpi jest wyraźnie pokazana w szóstym wierszu za pomocą opcji -verbose w poleceniu identyfikacji.
Tak więc odpowiedź slhck można zmodyfikować w następujący sposób.
pdfimages -j test.pdf test && dla pliku w $ (znajdź. -name "test * .jpg"); identyfikuj -verbose "$ file" | awk „NR == 6”; Gotowe
Z innej notatki próbowałem biec
identyfikacja -verbose test.pdf
Wygląda na to, że Imagemagick zawsze przyjmuje rozdzielczość 72 dpi, więc wydrukowane tutaj informacje wydają się nieprawidłowe.
źródło
Plik PDF nie ma właściwej rozdzielczości, każdy obraz rastrowy (jeśli taki istnieje) będzie miał własną rozdzielczość. Nie znam prostego sposobu na wyodrębnienie pojedynczej liczby dla mediany / rozdzielczości modalnej osadzonych obiektów XObject.
źródło
To działało z plikiem PDF wygenerowanym z Kyocera MFP ... Prawdopodobnie jest to poprawne tylko dla obrazów całej strony, takich jak skany.
Plik> Właściwości - karta Opis - Rozmiar strony. Mój przykład powiedział 8,5 x 11,0 cali.
Otwórz pdf w edytorze tekstu (notatniku), poszukaj
/width
i/height
Przykład:
Mój plik PDF został zeskanowany w rozdzielczości 600 x 600.
Możesz pominąć pierwsze 2 kroki, jeśli znasz rozmiar dokumentu (zazwyczaj A4 to 8,27 x 11,69).
źródło
Aby odpowiedzieć na drugi punkt, oprócz wzmianki @slhck o rozdzielczości drukarki, 300 dpi jest również typową minimalną zalecaną liczbą dla OCR z czcionkami o wielkości 10 + pt.
Co więcej, nowoczesny 15-calowy ekran laptopa 4K ma także tylko około 280Pi, więc jeśli chcesz wyświetlić cały A4 na ekranie (poziomo), nie ma sensu skanowania w rozdzielczości wyższej niż ~ 320 dpi, ponieważ każdy dokument wyższy niż ten będzie skalowane w dół. Oczywiście nie ma to znaczenia, jeśli planujesz powiększenie, wtedy możesz potrzebować wyższej rozdzielczości.
Aby odpowiedzieć na pozostałe dwa punkty, w dzisiejszych czasach przynajmniej możesz użyć Acrobat Pro do sprawdzenia DPI obrazu i rozdzielczości, a także możesz go edytować.
źródło