Niestety wydaje się, że obecnie nie ma jednego rozwiązania, które działałoby wystarczająco dobrze, ale ogromna lista realizowanych projektów.
Możesz przeszukać listę rozwiązań, aby sprawdzić, czy jest coś, co odpowiada Twoim potrzebom.
Dziobak :
Zawsze istnieje możliwość uruchomienia Dragon Naturally Speaking przy użyciu WINE . Projekt Platypus tworzy oprogramowanie, które przekierowuje dane wyjściowe Dragon do dowolnej aplikacji Linux / X i są one bardzo dalekie.
W tym artykule wyróżniono najlepsze oprogramowanie do rozpoznawania mowy typu open source dla systemu Linux. Należy pamiętać, że niektóre oprogramowanie jest na wczesnym etapie rozwoju i dlatego nie jest gotowe do powszechnego wdrożenia.
Przed przeanalizowaniem naszych rekomendacji Jasper zasługuje na specjalną wzmiankę. To doskonała platforma typu open source do opracowywania zawsze aktywnych aplikacji sterowanych głosem. Być może zastanawiasz się, dlaczego HTK nie pojawia się poniżej. Na pewno HTK to popularny zestaw narzędzi do rozpoznawania mowy. Jednak HTK nie może występować w zalecanych rozwiązaniach. Nie dlatego, że prawa autorskie są własnością firmy Microsoft, ale po prostu dlatego, że jest to oprogramowanie zastrzeżone.
Przyjrzyjmy się 6 dostępnym narzędziom do swobodnego rozpoznawania mowy. Dla każdego tytułu opracowaliśmy własną stronę portalu z pełnym opisem i dogłębną analizą jego funkcji.
Narzędzia do rozpoznawania mowy Open Source
DeepSpeech TensorFlow implementacja architektury DeepSpeech firmy Baidu.
Julius Dwukierunkowy duży aparat do ciągłego rozpoznawania mowy
Simon Elastyczne oprogramowanie do rozpoznawania mowy
CMUSphinx System rozpoznawania mowy dla aplikacji mobilnych i serwerowych
deepspeech.pytorch Implementacja DeepSpeech2 przy użyciu Baidu Warp-CTC.
Zestaw narzędzi Kaldi C ++ przeznaczony dla badaczy rozpoznawania mowy.
Możesz zainstalować wersję Chromium 11 z ppa ppa:chromium-daily/stable( Jak dodać PPA ) i dodać - enable-speech-input na końcu programu uruchamiającego.
Teraz odwiedź tę stronę i whoo! Przetwarzanie mowy na tekst na Ubuntu przy użyciu HTML5.
Czytam tutaj, że jeśli mówisz powoli, będzie to dokładniejsze.
Odpowiedzi:
W Wikipedii znajduje się cały artykuł poświęcony problemowi.
Niestety wydaje się, że obecnie nie ma jednego rozwiązania, które działałoby wystarczająco dobrze, ale ogromna lista realizowanych projektów.
Możesz przeszukać listę rozwiązań, aby sprawdzić, czy jest coś, co odpowiada Twoim potrzebom.
Dziobak :
Zawsze istnieje możliwość uruchomienia Dragon Naturally Speaking przy użyciu WINE . Projekt Platypus tworzy oprogramowanie, które przekierowuje dane wyjściowe Dragon do dowolnej aplikacji Linux / X i są one bardzo dalekie.
Zdecydowanie powinieneś na to spojrzeć.
źródło
Aby uzyskać zaktualizowaną odpowiedź, oto artykuł z marca 2018 r .: Najlepsze bezpłatne narzędzia do rozpoznawania mowy w systemie Linux - oprogramowanie Open Source .
Narzędzia do rozpoznawania mowy Open Source
źródło
Możesz zainstalować wersję Chromium 11 z ppa
ppa:chromium-daily/stable
( Jak dodać PPA ) i dodać - enable-speech-input na końcu programu uruchamiającego.Teraz odwiedź tę stronę i whoo! Przetwarzanie mowy na tekst na Ubuntu przy użyciu HTML5.
Czytam tutaj, że jeśli mówisz powoli, będzie to dokładniejsze.
źródło
freespeech-vr
Jest przyzwoitym silnikiem mowy na tekst typu open source. Tutaj kod źródłowy ( na Google Code )
Pamiętaj, że wymaga to trochę konfiguracji, która jest mniej dopracowana niż konfiguracja Dragon Naturally Speaking.
źródło
Dictanote
Aby rozwinąć odpowiedź Alaukika, istnieją aplikacje oparte na możliwościach rozpoznawania mowy Chrome.
Ja osobiście używam Dictanote (jest bardzo podobny do Dragon). Oto link do aplikacji Chrome .
źródło