Jak korzystać z rozpoznawania głosu używanego przez system Android na Ubuntu?

Jeśli opracowuję aplikację na Androida korzystającą z TTS i rozpoznawania głosu, które biblioteki są używane do tego samego rozpoznawania głosu i mowy w systemie Ubuntu?

Zakładam, że wypowiadam się za tekstem na mowę, ale nie jestem pewien, która biblioteka rozpoznawania głosu i system słownikowy / uczenia się / kalibracji jest używany do rozpoznawania głosu.

Chcę udostępnić aplikację na Ubuntu Desktop.
a także przetestuj go poza emulatorem

application-development voice-recognition RobotHumans
źródło

sprawdź to, ale nie ma istotnej odpowiedzi

devav2

@ devav2 dzięki za wysiłek, ale tak naprawdę nie związany. logowanie głosowe i który zestaw narzędzi do rozpoznawania głosu jest używany na Androidzie (i jeśli jest dostępny w Ubuntu) to dwie zupełnie różne rzeczy.

RobotHumans,

Prawdopodobnie będziesz musiał dokładnie dowiedzieć się, jakich bibliotek używa Android w innym miejscu, a następnie wróć tutaj i zapytaj, jak z nich korzystać w Ubuntu. Jeśli nie możesz go znaleźć w dokumentacji Androida , mogą pomóc entuzjaści Androida lub przepełnienie stosu .

ændrük

Nie jestem pewien, czy chcesz go używać z Androidem, ale Festival / festvox brzmi o wiele mniej robotycznie niż espeak. Jeśli chodzi o rozpoznawanie mowy, może pomóc en.wikipedia.org/wiki/… .

Adam

Cóż, espeak jest teraz standardem na pulpicie Ubuntu ... więc nie dodano żadnej zależności. Z drugiej strony, płatne paczki z cepstralu nie są przerażająco drogie i graniczą ze skeksi.

RobotHumans

Odpowiedzi:

Możesz użyć interfejsu API Google Webspeech do swojej aplikacji. Wykorzystuje tę samą technologię, co w Androidzie.

ishitor
źródło

Jeśli edytujesz trochę więcej danych, dam również ten

plik

Szczerze mówiąc, nie miałem wystarczającego doświadczenia z interfejsem API, aby podać te informacje!

ishitor

Może to być interesujące uzupełnienie: Projekt bez kości, który ma przenieść mowę Google'a na tekst na mój pulpit.

Stéphane Gourichon,

Rozpoznawanie głosu przez androidy opiera się na połączeniu internetowym, ponieważ serwer ma obszerną bazę danych wzorców głosu. (Myślę)
- Komputery nie są jeszcze bardzo dobre w rozpoznawaniu głosu, więc potrzebujesz ogromnej bazy danych z dużą ilością głosów, aby komputer mógł się do nich odwoływać i lepiej rozumieć słowa. (Przynajmniej przestudiowałem to)
- Dlatego nie możesz używać go offline.
Możesz jednak użyć rozpoznawania głosu do pisania za pomocą obejścia
- Poprzez utworzenie połączenia zdalnego pulpitu / vnc i bezpośredniego
- lub za pomocą zdalnej aplikacji klawiatury.

Chrome może używać rozpoznawania głosu do wyszukiwania, a wraz z rozszerzeniem może służyć do wypełniania danych w terenie. ale o ile wiem, to wszystko.

i to wszystko co wiem.

TardisGuy
źródło

Rozumiem, że rozpoznawanie głosu wymaga korpusu do nauki słów wykraczających poza prostą fonetykę i słowniki (więc można wymazać dopasowania, gdy się nie wymawia). Nie mam nic przeciwko wymaganiu połączenia z Internetem, jeśli jest ono użyteczne.

RobotHumans

Być może używasz CMU Sphinx, można go użyć jako zestawu narzędzi do rozwijania rozpoznawania mowy zarówno w systemie Linux, jak i Android: CMU Sphinx

oentoro
źródło