Muszę przetworzyć niektóre pliki PDF. Zadanie polega na wymianie danego pliku obrazu na inny. Mój pierwszy problem dotyczy sposobu zastąpienia obrazu PDF z wiersza poleceń w procesie wsadowym. Następnie spróbuję rozwiązać inne problemy, takie jak określenie, który obraz muszę wymienić (ponieważ pliki PDF mogą zawierać więcej niż jeden obraz). Ale najpierw chcę rozwiązać pierwszy problem: jak zamienić obraz w pliku PDF na inny.
Czytałem o poppler-utils i pdftk, ale o ile wiem, żadne z tych narzędzi nie pozwala na zamianę obrazów na PDF.
command-line
pdf
images
Ivan
źródło
źródło
Odpowiedzi:
OK ... Myślę, że
pdflatex
tutaj brakuje kawałka.OP powiedział, że sprawdził
poppler-utils
ipdftk
. Pozwól mi dodać do tegopdfimages
. Są to razem zpdflatex
rozwiązaniami.W powyższym przykładowym kodzie
pdfimages
przegląda strony od 4 do 20target.pdf
i wyodrębnia wszystkie obrazy do plików o rozpoczynających się nazwachimageroot
.poppler-utils
zapewniapdftotext
. Polecam-layout
opcję, która wykonuje świetną robotę, utrzymując dokument czytelny dla człowieka.Sprzeciw OP wobec
imagemagick
rozwiązania oferowanego przez pidozaura polega na tym, że obraz nie ma tekstu do wyodrębnienia. Dzięki narzędziom, które opisałem, OP będzie teraz zawierał wszystkie obrazy, a także cały wyodrębniony tekst, a numery stron i zawartość zostaną zachowane przez-layout
opcję. OP może zidentyfikować poprawną stronę tekstu i wrzucić go do.tex
pliku, który kończy się%includegraphics
dyrektywą i odnosi się do zastępczego obrazu według nazwy pliku. Następniepdflatex
to i powstaje nowy jednostronicowy plik .pdf, który można wstawić do reszty dokumentupdftk
. Jeśli wiesz, gdzie w tekście oryginalnej strony znajduje się obraz, możesz%includegraphics [h]
i umieścić obraz we właściwym miejscu.źródło