Jak edytować tekst w zeskanowanym pliku .jpeg?

14

Muszę przesłać zeskanowany obraz jako dokument PDF.

Po zeskanowaniu dokumentu mam .jpegmały tekst, który chcę edytować przed konwersją do formatu PDF w celu przesłania.

Nigdy wcześniej tego nie robiłem, więc naprawdę utknąłem. W jaki sposób mogę to zrobić?

Mysterio
źródło
3
Użyj GIMP, aby usunąć niechciany tekst, jest to teraz obraz, po prostu zakryj go białym prostokątem.
Uri Herrera,
Po prostu nie chcę go wymazać, chcę zastąpić go tylko dwoma słowami
Mysterio,
Umieść biały prostokąt nad tym, czego nie chcesz, a następnie umieść tekst za pomocą narzędzia tekstowego.
Uri Herrera,
1
@Mysterio może poczekać 9 godzin? Jeśli tak, wyślij mi e-mailem dokument, a zrobię to, to proste. Jeśli nie, zobacz odpowiedź OCR poniżej i powodzenia.
Tom Brossman,
3
JEŚLI dotyczy to tablicy rekrutacyjnej, czy mądrze jest edytować tekst i starać się, aby wyglądał on autentycznie? W zależności od sytuacji może to być nielegalne.
Przywróć Monikę - ζ--

Odpowiedzi:

27

Aby tekst był .jpegedytowalny, potrzebujesz oprogramowania do optycznego rozpoznawania znaków (OCR). Używam ocrfeeder.

sudo apt-get install ocrfeeder

Aby otworzyć plik obrazu, kliknij znak „plus” (+).
wprowadź opis zdjęcia tutaj Po otwarciu obrazu kliknij następną ikonę po prawej stronie, aby uruchomić OCR.
wprowadź opis zdjęcia tutaj
Po zakończeniu OCR'owania obrazu, możesz zaznaczyć tekst po lewej stronie i skopiować go po prawej stronie.
wprowadź opis zdjęcia tutaj

Najłatwiejszym sposobem na wyjęcie tekstu jest po prostu skopiowanie go do LibreOffice. Po niewielkiej edycji moja kopia wygląda bardzo podobnie.

wprowadź opis zdjęcia tutaj

Po wprowadzeniu wymaganych zmian możesz je wyeksportować .pdf, klikając „eksportuj jako pdf” z paska narzędzi LibreOffice. wprowadź opis zdjęcia tutaj

Ostatecznie najlepiej przeskanować, .pdfjeśli możesz. Jeśli nie możesz, działa to bardzo dobrze.

UWAGA: OCR nie jest w 100% dokładny, może być konieczne poprawienie błędów, a im więcej formatowania dokumentu, tym trudniej będzie.

Seth
źródło
3
+1, to zdecydowanie daje najlepsze wyniki. Inne metody obejmujące manipulowanie obrazami JPEG mogą wyglądać dość źle, jeśli tekst jest aliasowany, OCR pozwala uniknąć tego problemu.
Tom Brossman,
@TimWolla To zależy, czy plik JPG jest oparty na grafice czy tekście. Gdy czytam pytanie, JPG było grafiką z pewnym tekstem.
philshem
11

Nie można edytować tekstu w pliku JPG, ale usuwa się go i dodaje nowy tekst.

W przypadku obrazów wypróbuj gimp (alternatywa open source dla Photoshopa). Otwórz obraz za pomocą gimp, a następnie użyj narzędzia do wymazywania, aby usunąć stary tekst. Następnie użyj narzędzia tekstowego, aby dodać nowy tekst.

Lub użyj programu inkscape , który jest programem do grafiki wektorowej (podobny do programu Adobe Illustrator). Utwórz nowy plik SVG i wklej do pliku JPG. Następnie przykryj stary tekst nowym polem tekstowym.

Zacznę od gimp, ale dla twojego obrazu może inkscape działa lepiej. Możesz zainstalować dowolny kod z centrum oprogramowania lub użyć tych linii w terminalu

sudo apt-get install gimp

sudo apt-get install inkscape
philshem
źródło
7

Możemy również edytować tekst na obrazie za pomocą Libre Office, skąd możemy łatwo eksportować te pliki jako PDF.

  • Otwórz dokument, aby wstawić obraz z Wstaw -> Obraz -> Z pliku ... .

    wprowadź opis zdjęcia tutaj

  • Następnie wybierz „Zawiń -> W tle” z menu kontekstowego prawym przyciskiem myszy na właśnie wstawionym obrazie.

  • Napisz dowolny tekst nad obrazem (ale będziemy musieli umieścić go ze znakami nowej linii oraz spacjami lub tabulatorami). Każdy istniejący tekst musi zostać nadpisany. W poniższym przykładzie zrobiłem to, wybierając czarne tło i biały kolor czcionki.

    wprowadź opis zdjęcia tutaj

  • Wreszcie możemy zrobić „Plik -> Eksportuj jako PDF ...” .

Takkat
źródło
0

Nie można bezpośrednio edytować tekstu w pliku obrazu. Możesz edytować plik obrazu za pomocą programu, takiego jak gimpi umieścić nowy tekst na starym, ale to wszystko. Przepraszam.

Alex L.
źródło
Wyszukaj oprogramowanie OCR . Źle zrozumiałeś pytanie.
Lucio
0

Czasami nie chcę wydrukować strony i przekonwertować jej. Następnie używam tego małego skryptu:

Jak natychmiast wyodrębnić tekst z obszaru ekranu za pomocą narzędzi OCR?

Jest to dla mnie najszybszy sposób konwersji obrazu na tekst i działa prawie bardzo dobrze.

Tak więc sugeruję, abyś zeskanował dokument i otworzył obraz. Jednocześnie otwierasz edytor i kopiujesz potrzebne części do edytora. Za pomocą easystroke wykonujesz gest dla skryptu, jest to naprawdę łatwe i szybkie.

Onar
źródło