Inteligentny plik PDF różny

9

Mam dokument LibreOffice, który w pewnym momencie przekonwertowałem na format PDF, korzystając z wbudowanych funkcji. Znacznik czasu w pliku PDF jest późniejszy niż w dokumencie edytora tekstów, więc ma to sens, ale nie jestem absolutnie pewien, czy dokument edytora tekstu tworzy dokładnie ten plik PDF. Dokument ma 20 stron, więc sprawdzanie go ręcznie nie jest dobrym pomysłem.

Jedną z możliwości jest powtórzenie pliku PDF w innym folderze, a następnie wykonanie różnic binarnych dwóch plików PDF. Niestety wiersz poleceń diffwskazuje, że „pliki binarne są różne”.

Czy istnieje „inteligentny binarny plik różnicowy”, który pomoże mi ustalić, czy różnica dotyczy jedynie metadanych, czy jakiejś innej nieistotnej różnicy?

H2ONaCl
źródło

Odpowiedzi:

13

Zasadniczo dobrym pomysłem jest sprawdzenie, czy rozszerzenie poleceń + pliku jest tym, czego szukasz. wyniki diff + pdf w diffpdf .

sudo apt-get install diffpdf

DiffPDF służy do porównywania dwóch plików PDF. Domyślnie porównanie dotyczy tekstu na każdej parze stron, ale obsługiwane jest także porównywanie wyglądu stron (na przykład, jeśli schemat zostanie zmieniony lub sformatowany akapit). Możliwe jest również porównanie poszczególnych stron lub zakresów stron. Na przykład, jeśli istnieją dwie wersje pliku PDF, jedna ze stronami 1-12, a druga ze stronami 1-13 z powodu dodania dodatkowej strony jako strony 4, można je porównać, określając dwa zakresy stron, 1 -12 dla pierwszego i 1-3, 5-13 dla drugiego. Spowoduje to, że DiffPDF porówna strony w parach (1, 1), (2, 2), (3, 3), (4, 5), (5, 6) i tak dalej, do (12, 13).

wprowadź opis zdjęcia tutaj

Źródło: Ubuntugeek.com .

Rinzwind
źródło