Możliwa duplikat:
Jakiego darmowego oprogramowania mogę użyć do prostowania zeskanowanych obrazów
Mam kilka plików PDF zawierających skany stron książek. Skany są wykonywane z dwóch stron jednocześnie, a niektóre z nich są pochylone, dzięki czemu tekst wydaje się lekko pochylony.
Szukam narzędzia, które pozwoliłoby mi przeprowadzić automatyczną optymalizację poprzez prostowanie skanów bez utraty czytelności. Znalazłem oprogramowanie Briss Briss do przycinania skanów w celu uzyskania proporcji strony 1: 1 zamiast 2: 1, ale nie mam żadnego narzędzia do prostowania stron.
Natknąłem się na unpaper , kolejne narzędzie open source, które wydaje się idealne do tego, co chcę robić, ale to narzędzie jest tylko Linux i nie działa bezpośrednio na plikach PDF.
Każda podpowiedź jest mile widziana.
źródło
Odpowiedzi:
Spójrz na prostowanie . To narzędzie wiersza polecenia. Plik zip * do pobrania * wydaje się zawierać pliki binarne dla systemów Windows, MacOSX i Linux.
Licencja to MPL (Mozilla) lub LPGL (GNU), cokolwiek wolisz.
Jedyną wadą wydaje się to, że nie zużywa plików PDF, a jedynie obrazy PNG i TIFF (AFAICS). Oznacza to, że będziesz musiał skonfigurować przepływ pracy s.th. lubić:
Nie przetestowałem go jeszcze (jeszcze), niedawno trafiłem na stronę i dodałem do zakładek.
źródło
deskew
udało mi się skorygować zniekształcenie związane z obrotem podczas mojego testu, ale niestety wprowadzono cienką szarą linię w miejscu oryginalnej krawędzi obrazu. Aby pozbyć się szarej ramki, przyciąłem zdjęcia z-extent
opcjąmogrify
. Testowałem tylko na OS X, być może to złe zachowanie jest specyficzne dla platformy.deskew
działa naprawdę dobrze. Moja pracy jest tak: pdfimages-all <pdf> my_images
→ JBIG2-s -p -v my_images* > output
→pdf.py output > deskewed.pdf
Jeśli czarnymi pasami (wynik działania prostowanie) przeszkadza, niektóre przetwarzania z ImageMagick może być konieczne, jak sugeruje @StefanSchmidtOch, pozwól mi dodać kolejną odpowiedź. Właśnie pamiętałem netpbm . Nie korzystałem z niego od lat, ale myślę, że powinienem spojrzeć świeżo ...
netpbm to bardzo potężny zestaw narzędzi do wiersza poleceń do manipulowania obrazami graficznymi. Dostarcza prawie 300 osobnych narzędzi. Zawiera konwertery dla około 100 formatów graficznych.
Ma także narzędzie wiersza polecenia, które może obracać obrazy:
I ma inne narzędzie, które próbuje odkryć kąt obróconych obrazów:
pamtilt
zwraca zmienną liczbę przypuszczeń obrotu obrazu. Dlatego automatyczne usuwanie pochylenia obrazów powinno być w zasięgu ręki. W tym celu można napisać skrypt powłoki. Wymagałoby to różnych kroków:pamtilt
do automatycznego wykrywania kąta pochylenia obrazu.pnmrotate
aby przesunąć obraz.Jeśli zapewnisz mi dostęp do małej próbki twoich plików PDF, mógłbym spróbować wymyślić skrypt powłoki, aby dokonać tego wyczynu.
(Zastanawiam się mocno, że [netpbm] nie chciał mieć tutaj tagu w superużytkowniku + przepełnienie stosu.)
źródło