Pytania oznaczone «ocr»

2
Edytowanie przeszukiwanego OCR .pdf

Mój przypadek jest dość specyficzny, więc postaram się go wyjaśnić szybko i precyzyjnie. Muszę zdigitalizować kilka starych arkuszy papieru o wymiarach 230 mm x 268 mm (~ 9 "x 27,7") złożonych w 4 części; możesz znaleźć szybki przykład tutaj uzyskać pomysł. Skanowanie i ponowne składanie nie...

2
Ukryty tekst DjVu → ​​PDF?

Czy istnieje sposób na utworzenie pliku PDF tylko ukrytej warstwy tekstowej pliku DjVu? Wiem jak używać djvused myfile.djvu -e 'output-txt' > myfile.dsed aby wygenerować skrypt DjVu, który zawiera współrzędne x, y każdego słowa na każdej stronie, ale jak przekonwertować to na PS lub PDF?...

2
Zrozumienie opcji OCR w Adobe Acrobat: „Obraz możliwy do przeszukiwania”, „Obraz możliwy do przeszukiwania (Dokładnie)” oraz „Tekst edytowalny i obrazy”

W programie Adobe Acrobat (jeśli to ważne, używam Pro DC) istnieją trzy opcje OCR: „Obraz do przeszukiwania”. „Obraz do przeszukiwania (Dokładnie)”. „Edytowalny tekst i obrazy”. Jakie są różnice między tymi trzema opcjami? W szczególności, co determinuje rozmiar pliku wyjściowego? W tej...

1
Skopiuj warstwę tekstową pdf na inny pdf

Załóżmy, że masz 2 „zeskanowane” pliki pdf. Duży, ale bez warstwy tekstowej. Mniejszy (z obrazami o niższej jakości), ale z prawidłową warstwą tekstową. Oba pliki zawierają równe obrazy, różniące się jedynie kompresją. Celem jest osadzenie tej samej warstwy tekstowej w 1. pdf. „Tylko...

0
Czy mogę „przywrócić” do pliku PDF bez OCR?

Korzystam z Automatora w połączeniu z Abbys Finereader, aby oglądać folder dla nowych zeskanowanych dokumentów PDF. Program Finereader OCR zapisuje dokument i eksportuje go do nowego pliku PDF w tym samym folderze. Od miesiąca korzystam z ustawienia eksportu „tekst na obrazie strony”. Objaśnienia...

0
Czy powinienem używać treningu lstm lub TIFF / BOX?

Zamierzam tesseract przeszkolić, aby rozpoznać informacje poufne (3-literowe, po których następują cyfry, chodzi o to, aby znaleźć 3 litery, więc po przetworzeniu możemy zablokować ten dokument, ponieważ ma on poufne informacje). Podczas gdy poufne informacje mają wysoki priorytet, dokładność...