Szukam dobrego programu, który pokazałby mi różnice między dwoma podobnymi plikami pdf. W szczególności szukam czegoś, co nie tylko uruchomi różnicę w wersji ascii (z „pdftotext”) plików. To właśnie robi pdfdiff.py .
39
Szukam dobrego programu, który pokazałby mi różnice między dwoma podobnymi plikami pdf. W szczególności szukam czegoś, co nie tylko uruchomi różnicę w wersji ascii (z „pdftotext”) plików. To właśnie robi pdfdiff.py .
Odpowiedzi:
Możesz do tego użyć DiffPDF . Z opisu:
źródło
sudo apt-get install diffpdf
.Właśnie wymyśliłem włamanie, aby DiffPDF (program sugerowany przez @qbi) mógł być wykorzystywany do więcej niż drobnych zmian. To, co robię, to łączenie wszystkich stron pdf w długi przewijanie za pomocą pdfjam, a następnie porównywanie zwojów. Działa nawet po usunięciu lub wstawieniu dużych sekcji!
Oto skrypt bash, który wykonuje zadanie:
źródło
Chociaż to nie rozwiązuje problemu bezpośrednio, oto dobry sposób na zrobienie tego wszystkiego z wiersza polecenia z kilkoma zależnościami:
https://linux.die.net/man/1/pdftotext
Działa naprawdę dobrze w przypadku podstawowych porównań pdf. Jeśli masz nowszą wersję pdftotext, możesz spróbować
-bbox
zamiast-layout
.Jeśli chodzi o różne programy, lubię używać rozproszonego, więc polecenie zmienia się nieznacznie:
http://diffuse.sourceforge.net/
Mam nadzieję, że to pomaga.
źródło
Jeśli masz 2-3 duże pliki pdf (lub epub lub inne formaty, czytaj poniżej) do porównania, możesz połączyć moc:
calibre (do konwersji źródła na tekst)
meld (do wizualnego wyszukiwania różnic między plikami tekstowymi)
równoległy (aby przyspieszyć wszystkie rdzenie systemu)
Poniższy skrypt akceptuje jako dane wejściowe dowolny z następujących formatów plików: MOBI, LIT, PRC, EPUB, ODT, HTML, CBR, CBZ, RTF, TXT, PDF i LRS.
Jeśli nie jest zainstalowany, zainstaluj meld, calibre i równoległy:
Aby móc wykonać kod z dowolnego miejsca na komputerze, zapisz następujący kod w pliku o nazwie „diffepub” (bez rozszerzeń) w katalogu „/ usr / local / bin”.
Upewnij się, że właścicielem jest Twój użytkownik i ma uprawnienia do wykonywania:
Aby to przetestować, po prostu wpisz:
Testuję to, aby porównać 2 wersje pdf +1600 stron i działa idealnie. Ponieważ kaliber został napisany za pomocą Pythona w celu przenoszenia, konwersja obu plików na tekst zajęła 10 minut. Powolny, ale niezawodny.
źródło