Chciałbym zeskanować sporą liczbę papierów, które leżą wokół, przy najmniejszym możliwym problemie. Chciałbym przekonwertować je na obrazy za pomocą Simple Scan, a następnie przekonwertować na tekst za pomocą OCR. Czy jest dobra aplikacja OCR z GUI, która da mi dobre wyniki za naciśnięciem jednego przycisku?
77
Odpowiedzi:
GOCR from to program OCR (Optical Character Recognition), który konwertuje zeskanowane obrazy tekstu z powrotem do plików tekstowych.
CLARA to kolejna dobra opcja graficzna.
OCRAD from to OCR może być używany jako samodzielna aplikacja konsolowa lub jako backend do innych programów.
KOOKA from to aplikacja KDE, ale działa dobrze, ponadto musisz zainstalować rzeczywiste programy OCR, takie jak GOCR i OCRAD. Po zainstalowaniu Kooka i programów OCR, musisz wskazać Kooka lokalizację instalacji OCR, aby mogła przekonwertować JPEG na tekst.
OCRFeeder ze jest analiza dokumentów i układ optyczny system rozpoznawania znaków.
Tesseract ze to narzędzie wiersza poleceń i jest bardzo prosty w use.You można zainstalować pakiet językowy tesseract-OCR-eng od tutaj .
Spójrz na tę stronę .
Uwaga:
Aby uruchomić terminal goto tesseract i wpisz następujące polecenie
Tesseract może odczytać tylko plik TIFF - jeśli masz plik JPEG, PDF lub cokolwiek innego, musisz go przekonwertować. Ponadto rozszerzenie nazwy pliku musi mieć rozszerzenie .tif, a nie .tiff, w przeciwnym razie wystąpią błędy.
źródło
tesseract
(3.04.00 na Ubuntu 15.10) nie ma problemów zPNG
plikami wejściowymi. akceptujeJPG
pliki, ale daje im gorszy wynik, jak można się spodziewać po dodatkowych artefaktach kompresji.Istnieje kilka popularnych narzędzi wiersza polecenia OCR, których można użyć (nie jestem pewien, czy mają GUI):
Tesseract ( ReadMe , FAQ ) (Python)
Dostępne również dla: Tesseract .NET , Tesseract iOS
Stosowanie:
GOCR
OCRopus ™ ( FAQ ) (napisane w Python, NumPy i SciPy)
Tessnet2 (Open source, OCR, Tesseract, .NET, DOTNET, C #, VB.NET, C ++ / CLI)
Kilka innych: ABBYY CLI OCR dla Linux , Asprise OCR
Aby uzyskać bardziej kompletną listę, sprawdź: Lista oprogramowania do optycznego rozpoznawania znaków z Wikipedii
Zobacz także:
wanghaisheng/awesome-ocr
- Wyselekcjonowana lista obiecujących zasobów OCR w GitHub.źródło
rozwiązanie linux-intelligent-ocr
zrzeczenie się odpowiedzialności - jestem ściśle związany z opracowaniem tego rozwiązania typu open source
Lios może konwertować wydruk na tekst za pomocą skanera lub aparatu.
Może także tworzyć tekst ze skanowanych obrazów z innych źródeł, takich jak PDF, obraz lub folder zawierający obrazy.
Program ma całkowitą dostępność dla osób niedowidzących.
Ponieważ jestem blisko związany - chętnie przesyłam opinie.
źródło
Gscan2PDF
OCR na wielostronicowych plikach PDF lub zeskanowanych dokumentach
To chyba najłatwiejszy sposób. Gscan2pdf to narzędzie graficzne, które pozwala nie tylko skanować pliki, ale także importować pliki i wykonywać na nich OCR. Zainstaluj gscan2pdf stąd , z Centrum oprogramowania Ubuntu lub uruchamiając to polecenie w terminalu:
Gscan2PDF może korzystać z dostosowywanych silników OCR, domyślnie jest to
tesseract-ocr
Możesz rozważyć wybór odpowiedniego języka. W takim przypadku musisz zainstalować
tesseract-ocr-LANG
pakiet, w którymLANG
jest trzyliterowy kod języka ISO 639-2. W tej chwili masz 108 języków na repozytorium 16.04.źródło
Właśnie odniosłem sukces (poniżej 16.04) z pdfocr.rb . Jest to wymienione na wiki Ubuntu
Oto ppa, ale repozytorium dla 16.04 nie zostało zaktualizowane. Powyższy skrypt ruby z github nadal działa z 16.04.
Możesz pobrać go z Github. Będziesz potrzebował następujących pakietów:
następnie uczynił plik pdfocr.rb wykonywalnym i uruchomił:
Opcjonalnie możesz użyć
-l LANG
parametru. W takim przypadku musisz zainstalowaćtesseract-ocr-LANG
pakiet, w którymLANG
jest trzyliterowy kod języka ISO 639-2. W tej chwili masz 108 języków na repozytorium 16.04.źródło
Najlepszym i najłatwiejszym sposobem na jego użycie
pypdfocr
nie jest zmiana pliku pdf. pypdfocr to link do modułu python tutaj.Na koniec będziesz miał inny
your_document_ocr.pdf
sposób, w jaki chcesz, z tekstem do przeszukiwania. Aplikacja nie zmienia jakości obrazu. Zwiększa nieco rozmiar pliku, dodając tekst nakładki.Myślę, że polecenie jest dość łatwe, ponieważ nie wymaga GUI. Być może instalowanie pypdfocr jest nieco bardziej szczegółowe:
Aktualizacja 3 listopada 2018 r .:
pypdfocr
nie jest już obsługiwany od 2016 r. i zauważyłem pewne problemy z powodu braku opieki.ocrmypdf
( moduł wykonuje podobną pracę i może być używany w następujący sposób:Żeby zainstalować:
lub
źródło
Tylko dlatego, że działa bardzo ładnie i zdecydowanie powinien znajdować się na liście:
gimageReader
Przykład ze zrzutu ekranu:
Jest w repozytoriach (odpowiedział 18.10, ale używa go od wieków)
źródło
eng
jako opcja ... ale udało mi się! :) Uruchomieniesudo apt install tesseract-ocr-eng
terminalu załatwiło sprawę. Byłoby miło, gdyby zostało to udokumentowane w pliku pomocy gimageReadera lub „README” na githubie… czy gdzieś. Być może jak tutaj.gscan2pdf zawiera 3 różne silniki ocr. Możesz zeskanować bezpośrednio do programu lub zaimportować plik pdf do programu. Przekonałem się, że silnik Tesseract działa świetnie i jest bardzo łatwy w użyciu
źródło