Synteza mowy wymagająca bardzo małej wydajności procesora?

13

W czasach 8-bitowych komputerów osobistych z procesorem 1 MHz (Apple II, Atari 800 i in.) Istniały programy, które potrafiłyby na tych komputerach przeprowadzić zrozumiałą, arbitralną syntezę tekstu na mowę. Jakie opublikowane algorytmy syntezy mowy mogą być odpowiednie do implementacji na mikrokontrolerach o podobnie ograniczonej wydajności i pamięci? (Jeśli w ogóle...)

hotpaw2
źródło
Nie wiem, jak to zrobili, ale tutaj jest układ scalony allophone-to-audio o nazwie SpeakerJet, a oto powiązany generator tekstu na allophone . Możesz zapytać ludzi z speakjet.com, jak to zrobili ...
Kevin Vermeer
@KevinVermeer - Dlaczego nie opublikowałeś tego jako odpowiedzi? Otrzymalibyście ode mnie opinię, która stanowiłaby doskonałe uzupełnienie mojej własnej odpowiedzi.
Mark Booth

Odpowiedzi:

3

Metody, na których grałem na 8-bitowych komputerach domowych w latach 80-tych, polegały na tym, że miałem mały zestaw próbek fonetycznych, a następnie zdefiniowałem tekst, który chcesz wypowiadać na podstawie tych próbek.

Ponieważ nie wiedziałem wtedy o IPA , po prostu użyłem dwóch dźwięków na literę i przypisałem krótki dźwięk do małych liter, a długi dźwięk do wielkich liter. To pozostawiło jednak sporo luk, o dla / ɒ / ( gorący ) i O dla / oʊ / ( otwarty ) były łatwe, ale / uː / ( dźwięk oo w księżycu ) nie mógł być reprezentowany w moim systemie, który był to dla mnie problemem, ponieważ moje nazwisko (/ bud / rymy z / smuːð /, spróbuj je w Itinerarium s syntezy fonem stronie internetowej).

W dzisiejszych czasach możesz robić o wiele bardziej sprytne rzeczy. Na początek możesz użyć technik wyszukiwania do przetłumaczenia znanych słów w tekście ortograficznym na znane symbole fonetyczne , a dla nieznanych słów implementacja Phonics jako algorytmu powinna wykonać rozsądną robotę.

Po uzyskaniu strumienia fonetycznego możesz prawdopodobnie użyć technik DMA do przesyłania strumieniowego pojedynczych próbek fonemów z pamięci do DAC, przy mniejszym obciążeniu procesora.

Mark Booth
źródło