Od jakiegoś czasu szukam Google, ale nie mogę znaleźć odpowiedzi na moje pytanie.
Mam niechciane warstwy OCR w dokumencie, który ostatnio skanowałem za pomocą Adobe Acrobat. Nie został poprawnie rozpoznany, a ja chcę zmienić niektóre informacje, ale OCR sprawia, że poszukiwane informacje zostają usunięte. Przekształciłem pliki na TIF, ale zauważyłem (bardzo) znaczną utratę jakości. Słyszałem, że drukowanie do innego pliku PDF albo zachowuje tekst, albo zmniejsza jakość obrazu.
Doceniam wszelką pomoc w rozwiązaniu tego problemu JAK NAJSZYBCIEJ.
Dziękuję Ci.
źródło
Po wielu eksperymentach odkryłem, że drukowanie do Adobe PDF z Adobe Acrobat drukuje dokument bez OCR i bez utraty jakości (utrata niezauważalnej na pierwszy rzut oka rozdzielczości).
Jednak wiele stron twierdzi, że to nie działa. Próbowałem także innych drukarek, takich jak Foxit Reader i OneNote, ale jakość została zmniejszona. JPEG też był taki sam.
Pamiętaj, że Twój przebieg może się różnić.
Uwaga: zostawiam ten wątek oznaczony jako bez odpowiedzi w nadziei znalezienia lepszej odpowiedzi niż moja.
źródło
W programie Acrobat Pro: użyj „usuń ukryte informacje” (pod „ochrona”). Zaznacz wszystko, wykonaj, OCR zniknął
źródło
W programie Acrobat X, w obszarze Ochrona, znajduje się przycisk Dokument odkażania, który usuwa WSZYSTKO, ale to, co można zobaczyć (w tym warstwę tekstową OCR), przekształcając dokument na spłaszczoną mapę bitową.
źródło
(rok temu...)
Jeśli, jak mówisz, dokumenty są skanowane i nie są drukowane na przykład w formacie PDF z programu Word, możesz łatwo usunąć je za pomocą Adobe:
Wybierz Dokument, zbadaj dokument a teraz możesz usunąć ukryty tekst (OCR).
źródło
Zbudowałem narzędzie do tego darmowy PDF Redaktor . Jeśli prześlesz obraz i klikniesz redact, spłaszczy on Twój plik PDF i usunie OCR. Jeśli chcesz, możesz również narysować znaki redakcji na dokumencie.
źródło