Jak wspomniano przez innych, możesz używać pakietów anglojęzycznych 3.02 dla 3.03. Poniżej znajdują się instrukcje:
- Pobierz i rozpakuj stąd: 1
Zainstaluj wymagania wstępne i rozpakuj
`sudo apt-fast install -y libicu-dev libpango1.0-dev libcairo2-dev`
`tar xfv tesseract-ocr-3.02.eng.tar.gz`
Wyodrębnij angielski pakiet danych Tesseract do katalogu tessdata w katalogu tesseract-3.03. Zakładając, że zarówno (dane w języku angielskim, jak i źródłowe pliki .tar.gz tesseract) znajdują się w tym samym folderze
tar zxvf tesseract-ocr-3.02.eng.tar.gz
mv tesseract-ocr / tessdata / . tesseract-3.03 / tessdata /
4. Wróć do katalogu tesseract i zakończ instalację
cd tesseract-3.03
./autogen.sh
./configure
make -j
sudo make install LANGS="eng"
sudo ldconfig
Teraz przetestuj swoją instalację z obrazem testowym w katalogu
tesseract phototest.tif ans -l eng
cat ans.txt
Wynik:
Jest to 12-punktowy tekst do przetestowania kodu ocr i sprawdzenia, czy działa on na wszystkich typach formatów plików.
Szybki brązowy pies przeskoczył leniwego lisa. Szybki brązowy pies przeskoczył leniwego lisa. Szybki brązowy pies przeskoczył leniwego lisa. Szybki brązowy pies przeskoczył leniwego lisa.
UWAGA: niektóre wiersze mają nieprawidłowe formatowanie ... każda rada, aby je poprawić, byłaby świetna