Jeśli opracowuję aplikację na Androida korzystającą z TTS i rozpoznawania głosu, które biblioteki są używane do tego samego rozpoznawania głosu i mowy w systemie Ubuntu?
Zakładam, że wypowiadam się za tekstem na mowę, ale nie jestem pewien, która biblioteka rozpoznawania głosu i system słownikowy / uczenia się / kalibracji jest używany do rozpoznawania głosu.
Chcę udostępnić aplikację na Ubuntu Desktop.
a także przetestuj go poza emulatorem
application-development
voice-recognition
RobotHumans
źródło
źródło
Odpowiedzi:
Możesz użyć interfejsu API Google Webspeech do swojej aplikacji. Wykorzystuje tę samą technologię, co w Androidzie.
źródło
Rozpoznawanie głosu przez androidy opiera się na połączeniu internetowym, ponieważ serwer ma obszerną bazę danych wzorców głosu. (Myślę)
Komputery nie są jeszcze bardzo dobre w rozpoznawaniu głosu, więc potrzebujesz ogromnej bazy danych z dużą ilością głosów, aby komputer mógł się do nich odwoływać i lepiej rozumieć słowa. (Przynajmniej przestudiowałem to)
Dlatego nie możesz używać go offline.
Możesz jednak użyć rozpoznawania głosu do pisania za pomocą obejścia
Poprzez utworzenie połączenia zdalnego pulpitu / vnc i bezpośredniego
lub za pomocą zdalnej aplikacji klawiatury.
Chrome może używać rozpoznawania głosu do wyszukiwania, a wraz z rozszerzeniem może służyć do wypełniania danych w terenie. ale o ile wiem, to wszystko.
i to wszystko co wiem.
źródło
Być może używasz CMU Sphinx, można go użyć jako zestawu narzędzi do rozwijania rozpoznawania mowy zarówno w systemie Linux, jak i Android: CMU Sphinx
źródło