Konwertuj mowę (pliki audio MP3) na tekst

8

Szukam prostego konwertera z mp3 na txt. Próbowałem bezskutecznie: Julius, CMU Sphinx, ... W ciągu ostatnich 4 godzin nie znalazłem sposobu, jak z nich korzystać (lub prawidłowo je zainstalować).

To czego szukam to:

$ converterapp -infile myspeech.mp3 -outfile myspeech.txt

Nie przeszkadza mi także aplikacja GUI, ponieważ mam tylko kilka plików do konwersji i mogę klikać.

Edycja: za pomocą tej odpowiedzi Aplikacja do rozpoznawania mowy do konwersji plików MP3 na tekst? Zmodyfikowałem go, aby działał, ale nie generuje żadnych wyników. Właściwie tworzy kilka pustych linii (nie wykryto żadnych słów) ...

Samo
źródło
Jakie dokładnie polecenie wykonujesz i jakie wyniki widzisz?
Nikolay Shmyrev,
1
$ pocketsphinx_continuous -infile 1.wav -hmm en-us / cmusphinx-en-us-5.2 -lm en-us / en-70k-0.2.lm -logfn / dev / null &> otput.txt to dokładne polecenie zgodnie z @NikolayShmyrev pytanie. Pobrałem modele ze źródłaforge.net/projects/cmusphinx/files/… .
Samo

Odpowiedzi:

4

Pocketsphinx będzie przetwarzał mowę na tekst z istniejącego pliku audio. W zależności od początkowego formatu pliku mp3 mogą być potrzebne dwa osobne polecenia.

Najpierw przekonwertuj istniejący plik audio na obowiązkowy format wejściowy:

    ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav

Run sfinks

    pocketsphinx_continuous -infile file.wav 2> pocketsphinx.log > myspeech.txt

utworzony plik myspeech.txt będzie miał to, czego szukasz.


Jeśli jesteś nowy w Ubuntu, musisz zainstalować powyższe programy za pomocą tego polecenia:

    sudo apt install pocketsphinx pocketsphinx-en-us ffmpeg
64pi0r
źródło
0

Mozilla SpeechDeep zrobi narzędzie do edycji mowy na tekst. Będziesz musiał zainstalować aplikację na pulpicie Linuksa. Możesz też wypróbować Transcribear oparte na przeglądarce narzędzie do przetwarzania tekstu na mowę, które nie wymaga instalacji, ale musisz połączyć się z Internetem, aby przesłać nagranie na serwer.

Jan
źródło