Próbujesz przekonwertować plik PDF na tekst za darmo

11

Używam OSX i chciałbym móc konwertować pliki pdf na tekst.

Chciałbym, aby to zrobiła darmowa aplikacja, ponieważ jestem pewien, że muszą być jakieś.

macos Grant
źródło

2

Chcesz wyodrębnić tekst z plików PDF, które już zawierają tekst? (tj. możesz kopiować i wklejać fragmenty z nich) Czy chcesz rozpoznać tekst w treści obrazu?

Alan Shutko

Robi free-ocr.com Wsparcie?

Tim

10

Na prośbę Patrix, oto kroki, których użyłem do zainstalowania i używania xpdf przez Homebrew:

/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"

Zrób to, co każe ukończyć instalację Homebrew, a następnie wykonaj:

brew install Caskroom/cask/xquartz

brew install xpdf

pdftotext 98789_LogiqueAnalyse_232_08.pdf 98789_LogiqueAnalyse_232_08.txt

Pierwszą nazwą pliku był istniejący plik PDF; drugi to cel. Wyniki były znacznie lepsze niż w (co prawda starej) wersji Adobe Acrobat.

Flash Sheridan
źródło

2

Myślę że xquartz nie jest potrzebny dla narzędzi konsoli w xpdf. Ponadto istnieje poppler widelec xpdf co wydaje się znacznie bardziej aktywne: github.com/scraperwiki/scraperwiki-python/issues/…

Jeroen Wiert Pluimers

4

Wiele metod.

Posługiwać się Dokumenty Google (potrzebujesz konta Google)
Posługiwać się Automator (wymagana praca)

Za pomocą Automatora można utworzyć przepływ pracy, który może wyodrębnić tekst Pliki PDF i zapisz je jako tekst lub dokument RTF.

extract text from pdf

lub aplikacja z App Store, np. PDF do tekstu

Buscar웃
źródło

4

Aktualna wersja Adobe Reader (11.0.09) ma element „Zapisz jako inny” w menu Plik.

Jedną z opcji jest Tekst .

Aplikacja jest darmowa i wykonuje przyzwoitą pracę, generując pliki tekstowe. Wszystkie obrazy w nowym dokumencie zostaną utracone w formacie .txt.

Wayfaring Stranger
źródło

2

xpdf które zainstalowałem z portami:

port install xpdf

zawiera:

xpdf-pdftotext

Robi to, co chcesz dla każdego pliku PDF pochodzącego z plik tekstowy (a nie z obrazu):

xpdf-pdftotext PDF_file text_file

daniel Azuelos
źródło

1

Polecenie, przynajmniej zainstalowane przez HomeBrew, jest po prostu „pdftotext”.

Flash Sheridan

@Fashashheridan Czy mogę zachęcić Cię do wysłania odpowiedzi dotyczącej „pdftotext” i sposobu instalacji za pomocą homebrew? Komentarze mogą zostać usunięte w dowolnym momencie (a także nie pojawiają się w wyszukiwaniach).

nohillside

0

Myślę, że powinieneś móc kopiować i wklejać tekst do innego dokumentu. Aby zaznaczyć cały tekst

Otwórz plik PDF w „Podgląd” i

wybierz „Edytuj | Wybierz wszystko”
wybierz „Edytuj | Kopiuj”

Przejdź do innej aplikacji, powiedz „Edycja tekstu”

wybierz „Edytuj | Wklej”

Pamiętaj, że jeśli spróbujesz to zrobić, a nie ma wklejonego tekstu, tylko kilka pustych wierszy, spróbuj najpierw wydrukować plik PDF do nowego pliku PDF, np.

W Podglądzie wybierz „Plik | Drukuj”
W prawym dolnym rogu wybierz „PDF | Zapisz jako PDF”
Eksportuje nowy plik PDF.

Teraz wypróbuj powyższy proces z tym nowym plikiem PDF. Pracowałem dla mnie!

Brad Parks
źródło

1

Chociaż powinno to działać, gdy dokument PDF rzeczywiście zawiera tekst zawartość, nie zachowuje formatowania, aw niektórych przypadkach tworzy tekst śmieci wraz z tekstem, który zostałby uznany za pożądany. Zauważ, że może to być również to samo z innymi metodami, ale uważam, że ważne jest, aby zwrócić uwagę.

user3439894

bez wątpienia - na pewno nie jest idealny i całkowicie zgadzam się ze wszystkim, co powiedziałeś. Dodałem go tutaj tylko jako opcję, którą wcześniej zauważyłem, która działała dla mnie bez instalowania czegokolwiek ;-)

Brad Parks

Próbujesz przekonwertować plik PDF na tekst za darmo

Odpowiedzi:

Otwórz plik PDF w „Podgląd” i

Przejdź do innej aplikacji, powiedz „Edycja tekstu”