Jest xpdf, który zawiera pdftotext
plik binarny.
Pdftotext konwertuje pliki Portable Document Format (PDF) na zwykły tekst.
W systemie Linux dostępny jest instalator. Wygląda na to, że jest również w poppler-utils
pakiecie. W systemie OS X można go zainstalować za pomocą Homebrew (najpierw zainstalować), a następnie użyć
brew install homebrew/x11/xpdf
który pobierze pliki źródłowe i skompiluje je dla OS X. Następnie użyj go w następujący sposób:
pdftotext your_pdf_file.pdf
który wygeneruje zwykły plik tekstowy. Istnieje również kilka opcji, sprawdź man pdftotext
więcej szczegółów.
Alternatywą jest poppler w OSX:
brew install poppler
w Debianie i przyjaciołach
apt-get install poppler-utils
brew install homebrew/x11/xpdf
brew install Caskroom/cask/pdftotext
Ładnym narzędziem dla systemu Windows jest A-PDF Text Extractor
źródło