To przede wszystkim ciekawostka, ale czy są jakieś implementacje OCR w czystej Javie? Jestem ciekawy, jak by to działało wyłącznie w Javie, a OCR ogólnie mnie interesuje, więc chciałbym zobaczyć, jak jest zaimplementowany w języku, który dobrze rozumiem. Oczywiście wymagałoby to implementacji typu open source, ale nadal interesują mnie rozwiązania autorskie, bo w takim przypadku mógłbym przynajmniej sprawdzić wydajność.
Widziałem kilka, których można używać w Javie (jak Asprise ), ale nie wygląda na to, że są to implementacje w czystej Javie ... czy są jakieś?
Odpowiedzi:
Polecam wypróbowanie projektu Java OCR na sourceforge.net. Pierwotnie go opracowałem i publikuję na blogu .
Odkąd umieściłem go na sourceforge, jego funkcjonalność została znacznie rozszerzona i ulepszona dzięki wspaniałej pracy badacza / programisty wolontariusza.
Spróbuj, a jeśli Ci się nie spodoba, zawsze możesz to poprawić!
źródło
Przetestowaliśmy kilka silników OCR z Javą, takich jak Tesseract, Asprise, Abbyy itp. W naszej analizie Abbyy dała najlepsze wyniki.
źródło
ProcessBuilder
.Jeśli szukasz bardzo rozszerzalnej opcji lub masz konkretną domenę problemową, możesz rozważyć zmianę własnej za pomocą Java Object Oriented Neural Engine . Kolejna referencja JOONE .
Użyłem go z powodzeniem w osobistym projekcie, aby zidentyfikować list z obrazu takiego jak ten. Wszystkie źródła komponentu OCR mojej aplikacji można znaleźć tutaj na github .
źródło
Istnieje wiele bibliotek OCR. Jednak z mojego doświadczenia wynika, że główne implementacje komercyjne, ABBYY, Omnipage i ReadIris, znacznie przewyższają open-source lub inne pomniejsze implementacje. Te biblioteki komercyjne nie są przeznaczone głównie do pracy z Javą, chociaż oczywiście jest to możliwe.
Oczywiście, jeśli chcesz nauczyć się kodu, implementacje open-source załatwią sprawę.
źródło
Właśnie znalazłem ten (nie wiem, nie testowany, sprawdź sam)
Ron Cemer Java OCR
Ponieważ potrzebujesz tego tylko z ciekawości, możesz zajrzeć do źródła tego apletu.
Wykonuje OCR odręcznych znaków za pomocą sieci neuronowej
Java OCR: Rozpoznawanie pisma ręcznego
źródło