Alternatywa dla Dragon NaturallySpeaking?

Odpowiedzi:

18

W Wikipedii znajduje się cały artykuł poświęcony problemowi.

Niestety wydaje się, że obecnie nie ma jednego rozwiązania, które działałoby wystarczająco dobrze, ale ogromna lista realizowanych projektów.

Możesz przeszukać listę rozwiązań, aby sprawdzić, czy jest coś, co odpowiada Twoim potrzebom.

Dziobak :

Zawsze istnieje możliwość uruchomienia Dragon Naturally Speaking przy użyciu WINE . Projekt Platypus tworzy oprogramowanie, które przekierowuje dane wyjściowe Dragon do dowolnej aplikacji Linux / X i są one bardzo dalekie.

Zdecydowanie powinieneś na to spojrzeć.

Stefano Palazzo
źródło
5

Aby uzyskać zaktualizowaną odpowiedź, oto artykuł z marca 2018 r .: Najlepsze bezpłatne narzędzia do rozpoznawania mowy w systemie Linux - oprogramowanie Open Source .

W tym artykule wyróżniono najlepsze oprogramowanie do rozpoznawania mowy typu open source dla systemu Linux. Należy pamiętać, że niektóre oprogramowanie jest na wczesnym etapie rozwoju i dlatego nie jest gotowe do powszechnego wdrożenia.

Przed przeanalizowaniem naszych rekomendacji Jasper zasługuje na specjalną wzmiankę. To doskonała platforma typu open source do opracowywania zawsze aktywnych aplikacji sterowanych głosem. Być może zastanawiasz się, dlaczego HTK nie pojawia się poniżej. Na pewno HTK to popularny zestaw narzędzi do rozpoznawania mowy. Jednak HTK nie może występować w zalecanych rozwiązaniach. Nie dlatego, że prawa autorskie są własnością firmy Microsoft, ale po prostu dlatego, że jest to oprogramowanie zastrzeżone.

Przyjrzyjmy się 6 dostępnym narzędziom do swobodnego rozpoznawania mowy. Dla każdego tytułu opracowaliśmy własną stronę portalu z pełnym opisem i dogłębną analizą jego funkcji.

Narzędzia do rozpoznawania mowy Open Source

  • DeepSpeech TensorFlow implementacja architektury DeepSpeech firmy Baidu.
  • Julius Dwukierunkowy duży aparat do ciągłego rozpoznawania mowy
  • Simon Elastyczne oprogramowanie do rozpoznawania mowy
  • CMUSphinx System rozpoznawania mowy dla aplikacji mobilnych i serwerowych
  • deepspeech.pytorch Implementacja DeepSpeech2 przy użyciu Baidu Warp-CTC.
  • Zestaw narzędzi Kaldi C ++ przeznaczony dla badaczy rozpoznawania mowy.
WinEunuuchs2Unix
źródło
4

Możesz zainstalować wersję Chromium 11 z ppa ppa:chromium-daily/stable( Jak dodać PPA ) i dodać - enable-speech-input na końcu programu uruchamiającego.

wprowadź opis zdjęcia tutaj

Teraz odwiedź tę stronę i whoo! Przetwarzanie mowy na tekst na Ubuntu przy użyciu HTML5.

Czytam tutaj, że jeśli mówisz powoli, będzie to dokładniejsze.

wprowadź opis zdjęcia tutaj

Lincity
źródło
3

freespeech-vr

Jest przyzwoitym silnikiem mowy na tekst typu open source. Tutaj kod źródłowy ( na Google Code )

Pamiętaj, że wymaga to trochę konfiguracji, która jest mniej dopracowana niż konfiguracja Dragon Naturally Speaking.

dotancohen
źródło
2
Wydaje się, że FreeSpeech nie jest obsługiwany. Nie oferuje ppa od Ubuntu 10.
JellicleCat
2
Dostępny jest teraz port FreeSpeech dla Pythona 3 .
dotancohen