Sterowanie głosowe w środowisku pulpitu

16

Chciałbym włączyć system, który może reagować na polecenia głosowe użytkownika i uruchamiać skrypty zgodnie z poleceniem ustnym GIVEN.

Idealnie byłoby, gdyby komputer stale nasłuchiwał.

Gdy usłyszy brzęczące słowo „Komputer”, zostanie aktywowane i będzie nasłuchiwać poleceń przez 10 sekund (lub tak dalej).

Po aktywacji i podczas słuchania chciałbym, aby inny zestaw słów buzz mógł uruchamiać skrypty.

Na przykład....

(Komputer jest bezczynny) „Komputer” (komputer natychmiast nasłuchuje) „Uzyskaj dostęp do nowych KOMUNIKATÓW” (KOMUNIKATY to brzęczące słowo * IGNORES „ACCESS NEW” - komputer uruchamia skrypt i otwiera ewolucję lub empatię). Może być jeden do przeglądarki, jeden do zamykania okien i pokazywania pulpitu lub naprawdę wiele innych rzeczy.

Czy to w ogóle możliwe?

microphone voice-recognition BorgDomination
źródło

7

Gnome-Voice-Control

Opracowany w ramach Google Summer of Code 2007, pomysł polegał na opracowaniu niektórych funkcji, które poprawią użyteczność w Gnome Desktop.

Celem jest wdrożenie Desktop Control System. System składa się z aplikacji, która będzie monitorować wejście audio (mikrofon), a gdy wykryty zostanie znaczący sygnał audio, oprogramowanie wyłapuje, przetwarza i rozpoznaje sygnał, a następnie wykonuje pożądaną akcję na pulpicie Gnome. W zestawie działań może obejmować maksymalizację, minimalizację, zamknięcie aktywnego okna; otwórz konkretny program; przełączanie z jednego pulpitu na drugi; pośród innych. GnomeVoiceControl jest zaimplementowany w C w połączeniu z CMU Sphinx, który jest narzędziem typu open source, stworzonym do konwersji mowy na tekst.

Pokaz slajdów autorów

Niestety wygląda na to, że nie wykroczył on znacznie poza podstawowe „cele” - wydaje się jednak, że w tym roku pojawiły się działania, które dodają wsparcie dla nowych języków, takich jak bułgarski i turecki.

Żeby zainstalować:

sudo apt-get install gnome-voice-control

Dziobak

Jest ciekawie wyglądający dziobak wywołań projektu - w zasadzie jest to linuxowy interfejs Dragon Naturally Speaking, który działa w Wine.

Roszczenie do sławy tej aplikacji jest takie, że „może ona nawet uruchamiać programy i skrypty systemu Windows lub Linux, np.„ Uruchomić terminal ”.

VEDICS

Jest to nowy projekt, który mówi, że działa z interfejsem Unity.

Strona projektu mówi, że rozpoznaje „uruchom [nazwa programu]” - więc teoretycznie ty [nazwa programu] może być dowolnym skryptem, który chcesz uruchomić.

fossfreedom
źródło

Dziękuję za wyjątkowo szybką odpowiedź. Słyszałem o tym programie i zainstalowałem go, ale wydaje się, że nie przechodzi on wcześniejszej konfiguracji - mówi tylko „config”. Dziwi mnie, że na tym froncie nie wykonano wiele pracy. Czy może jest ekwiwalent systemu Windows, który mógłbym uruchomić z winem?

BorgDomination

1

starsza wersja głosu gnomu, która jest w synaptyce, dała mi takie same wyniki. Próbowałem najnowszych z witryny i wydawało się, że idzie dalej, ale nigdy nie udało mi się, aby działała poprawnie. ręczne zależności były uciążliwe.

Kendrick,

3

Simon Listens

Jest to projekt typu open source, którego celem jest zastąpienie myszy i / lub klawiatury rozpoznawaniem mowy, opracowanym początkowo dla osób niepełnosprawnych fizycznie.

Istnieje ppa, z którego możemy zainstalować aplikację: ppa: grasch-simon-listens / simon

Takkat
źródło

czy simon działa tylko z KDE? Wygląda naprawdę niesamowicie i zainstalowałem go, ale wydaje się, że nie działa z gnome-shellem. specjalnie do zarządzania oknami. Jeśli chcę na przykład wyświetlić wszystkie okna, będzie to działało inaczej w kde env i gnome env, prawda?

Joshua Robison

1

Zależności powinny zostać rozwiązane podczas instalacji na Ubuntu <= 12.04 z ppa, ale nie próbowałem ostatnio, a także nie mam pojęcia, jak może zakłócać działanie powłoki GNOME. Nie ma (jeszcze) wersji dla 12.10.

Takkat

3

Google2Ubuntu

Google2Ubuntu to narzędzie, które umożliwia sterowanie komputerem za pomocą poleceń głosowych za pośrednictwem interfejsu API rozpoznawania mowy Google.

Uruchom poniższe polecenia na terminalu, aby zainstalować google2Ubuntu,

sudo add-apt-repository ppa:benoitfra/google2ubuntu
sudo apt-get update
sudo apt-get install google2ubuntu

Źródło

Avinash Raj
źródło

1

Rozpoznawanie mowy w systemie Linux

Jest rozwijany do pracy pod dystrybucjami Linuksa, jest bardzo konfigurowalny i łatwy do rozszerzenia, obsługuje niestandardowe słowniki, rozpoznawanie kontekstowe, tryb dyktowania i konfigurowalne makra.

Aby zainstalować Linux Speech Recognition, przejdź do strony GitHub projektu . Pobierz plik ZIP i rozpakuj go.

Następnie zainstaluj niektóre zależności:

sudo apt-get install sox python-argparse libsox-fmt-mp3 mutt xvkbd xautomation

Otwórz rozpakowany folder (Palaver-master) w terminalu i uruchom instalację:

cd /~Path-to-folder~/Palaver-master/
./setup

Teraz wystarczy przypisać klawisz skrótu, aby włączyć nagrywanie. Aby to zrobić, przejdź do Ustawienia systemu ...> Klawiatura> Skróty> Skróty niestandardowe Kliknij przycisk Plus, aby dodać skrót, nazwij go Rozpoznawanie głosu i ustaw polecenie na:

/~Path-to-folder~/Palaver-master/hotkey

Kliknij Zastosuj, kliknij skrót, a następnie przypisz skrót, aby aktywować Rozpoznawanie głosu.

Zauważ, że nie wydano jeszcze stabilnej wersji, więc nie oczekuj, że polecenia będą w pełni funkcjonalne na tym etapie, wiele wyrażeń zostanie rozpoznanych, ale nie zostaną wykonane żadne działania.

Rodrigo Martins
źródło

Na razie Palaver nie żyje: github.com/JamezQ/Palaver/issues/110#issuecomment-398646686

user2740

0

Snips.ai

Właśnie wypróbowałem to na pi3 - wydaje się, że ma potencjalne
Runs w oknie dokowanym

https://snips.ai/

Paul Schneider
źródło

1

Witamy w Ask Ubuntu. Pamiętaj, że jeśli jesteś powiązany z tym narzędziem, musisz wyraźnie to powiedzieć w swoim poście; zobacz Jak nie być spamerem .

Glorfindel,

1

Oficjalna strona internetowa mówi: Open Source: Z czasem staramy się otwierać Snips , więc warto spróbować Snips.

karel