Pytania oznaczone «ocr»

Optyczne rozpoznawanie znaków (OCR) to proces konwertowania obrazów tekstu na tekst, którym można manipulować za pomocą edytorów tekstu itp.

20
Batch-OCR wiele plików PDF

To zostało omówione rok temu tutaj: Batch OCR dla wielu plików PDF (jeszcze nie OCRed)? Czy jest jakiś sposób na grupowanie plików PDF OCR, które nie zostały jeszcze OCRedowane? Myślę, że jest to obecny stan rzeczy dotyczących dwóch zagadnień: Partie plików PDF OCR Windows Acrobat - jest to...

13
Wyodrębnij tekst OCR z Evernote

Evernote wykonuje OCR na zapisywanych do niego obrazach. Czy istnieje sposób, aby uzyskać ekwiwalent pełnego tekstu dla obrazu w Evernote, czy OCR służy tylko do

12
Praktyczne rozwiązanie OCR do konwersji dużej książki na format cyfrowy?

Byłem w pobliżu miejsca mojego dziadka w ostatni weekend. Moja babcia wyciągnęła tę gigantyczną (około 1400 stron) książkę z historii swojej rodziny sięgającą 1630 roku. Gigantyczny nerd, którym jestem, pomyślałem, że byłoby fajnie mieć wszystkie informacje przechowywane w bazie danych i dostępne w...

11
Jak usunąć OCR z pliku PDF?

Od jakiegoś czasu szukam Google, ale nie mogę znaleźć odpowiedzi na moje pytanie. Mam niechciane warstwy OCR w dokumencie, który ostatnio skanowałem za pomocą Adobe Acrobat. Nie został poprawnie rozpoznany, a ja chcę zmienić niektóre informacje, ale OCR sprawia, że ​​poszukiwane informacje...

9
Dobry darmowy OCR z GUI do poprawiania błędów? (dla Windowsa)

Użyłem SimpleOCR , który ma ładny GUI do poprawiania błędów. Niestety popełnia wiele błędów! (i cierpi na inne błędy i ograniczenia) Z drugiej strony Tesseract jest dokładniejszy, ale w ogóle nie ma GUI. Moje pytanie brzmi: czy istnieje bezpłatny program OCR dla systemu Windows, który ma ładny...

6
Wyodrębnianie tekstu z zeskanowanej książki .PDF [zamknięte]

Zeskanowałem książkę w formacie PDF, ale jakość jest raczej niska: (Język jest rumuński i jest to książka z fizjologii medycznej, na wypadek gdybyś się zastanawiał) Chcę wyodrębnić tekst z książki (1500 stron), ale zachowuj obrazy tak, jak są. Naprawdę nie sądzę, że mam szansę znaleźć...

5
Jak sformatować dwie kolumny OCR PDF w jednej kolumnie

Mam problem z odczytaniem pliku PDF na moim Kindle, ponieważ tekst OCR jest wyświetlany w dwóch kolumnach na stronie. (IE Książka została zeskanowana dwie strony jednocześnie, OCR). Jak mogę sformatować to w jednej kolumnie (lub dowolnym innym stylu), aby móc czytać na moim...

4
Dane w języku angielskim Tesseract 3.03

Tesseract 3.03 został niedawno wydany i właśnie go zainstalowałem. Niemniej jednak dane do pobrania w języku angielskim nie są dostarczane (z https://launchpad.net/ubuntu/+source/tesseract/3.03.03-1 ). Na stronie Tesseract znajduje się link „Pobierz”, ale można znaleźć tylko „Dane w języku...

3
Jak mogę sprawić, by OCR lepiej rozpoznawał tekst moich dokumentów?

Nie mogę dostać niektórych moich dokumentów z obrazami do rozpoznania przez OCR. Nie są one szczególnie niskiej rozdzielczości - choć niektóre są zniekształcone - ale nie mogę ich uzyskać przez OCR nawet z Omnipage. Przesłałem jeden jako przykład (przekonwertowane z DOC na PDF dla Omnipage), ale...

3
Konwertuj plik PDF w wyszukiwarce

Szukam sposobu na konwersję tysięcy plików PDF do przeszukiwalnych plików PDF. Użyłem programu o nazwie „PDF Create Assistant”, który był dostarczany wraz z programem Nuance ecopy oprogramowanie. Nie możesz jednak wybrać folderu, musisz przejść do każdego podfolderu, wybrać pliki do...

3
Używanie OCR na tekście arabskim

Znajomy poprosił o konwersję arabskiego tekstu .pdf na Word. Dokumenty Google nie wydają się opcją, ale nowy OCR wyglądał obiecująco, ponieważ język arabski znajduje się w menu rozwijanym „Język rozpoznawania”. Nie udało mi się uruchomić tej funkcji poza „Błąd! Nie można rozpoznać tekstu”. nawet z...