Linux - polecenie usuwania obrazów z pdf

0

Mam plik pdf, który jest ogromny, ponieważ został wyeksportowany z Photoshopa i prawie nie mogę go otworzyć. Zawiera tekst, lubię kopiować / wklejać.

Czy istnieje polecenie usunięcia wszystkich obrazów z pliku pdf i zapisania wyniku jako nowego pliku?

Btw. Próbowałem już pdftotext, ale wynikowy plik jest zawalony, linia podzielona na maksymalnie 10 znaków, cała spacja i tak dalej.

AKTUALIZACJA

Znalazłem tu fajny wątek , ale żadne z rozwiązań nie zadziałało, więc myślę, że »photoshop pdf« jest naprawdę źle…

philipp
źródło

Odpowiedzi:

1

W zależności od tekstu, który chcesz wyodrębnić, może być lepiej uruchomić na nim pdf2txt .

eckes
źródło
tak lepiej, ale wciąż są w nim jakieś dziwne rzeczy, chyba kilka sekwencji ucieczki, takich jak: Di(cid:249)erentw tym… Ale dzięki za odpowiedź!
philipp