Szukam prostego w instalacji oprogramowania do konwersji tekstu na mowę dla systemu Ubuntu, które brzmi naturalnie. Mam zainstalowane Festival
, Gespeaker
itd, ale nic nie brzmi bardzo naturalnie. Wszystko bardzo syntetyczne i trudne do zrozumienia.
Jakieś rekomendacje?
software-recommendation
text-to-speech
I Heart Ubuntu
źródło
źródło
Odpowiedzi:
SVOX pico2wave
Bardzo minimalistyczny TTS, lepiej brzmiący niż espeak lub mbrola (moim zdaniem). Kilka informacji tutaj .
Nie rozumiem, dlaczego pico2wave jest rzadko omawiane w porównaniu do espeak lub mbrola. Jest mały, ale brzmi naprawdę dobrze (naturalnie). Bez modyfikacji usłyszysz naturalnie brzmiący żeński głos.
ORAZ ... w porównaniu do Mbroli rozpoznaje Jednostki i mówi to we właściwy sposób!
Na przykład:
Po instalacji używam go w skrypcie:
Następnie uruchom go z żądanym tekstem:
lub przeczytaj zawartość całego pliku:
To wszystko, aby mieć lekki, stabilny działający TTS na Ubuntu.
źródło
pico2wave
jest w pakiecielibttspico-utils
w najnowszych wersjach ubuntu. @ CarlosEugenioThompsonPinzóncat <filename> | xargs -I foo -0 pico2wave -w blah.wav foo
pico2wave -w a.wav "$(input.txt)"
=). Zgadzam się, że ten interfejs CLI ma zły projekt: w przeciwieństwie do ogromnej większości interfejsów CLI i możliwe jest osiągnięcie maksymalnej długości argumentu CLI dla systemu operacyjnego .echo {1..1000}
Powiedz to!
Wierzę, że znalazłem najlepsze oprogramowanie TTS za darmo, używając rozszerzenia Google Chrome o nazwie „SpeakIt”. Działa to tylko w przeglądarce Chrome dla Ubuntu. Z jakiegoś powodu nie działa z Chromium. SpeakIt ma dwa kobiece głosy, które brzmią bardzo realistycznie w porównaniu do wszystkiego innego. Są jeszcze co najmniej cztery głosy płci męskiej i żeńskiej na liście rozszerzeń Chrome, jeśli przeszukujesz Chrome Web Store za pomocą „TTS” jako zapytania.
Zastosowanie : Do użytku na stronie internetowej. zaznacz tekst, który chcesz przeczytać, albo kliknij prawym przyciskiem myszy i „SpeakIt”, albo kliknij ikonę SpeakIt zadokowaną na górnym pasku Chrome.
Użytkownicy przeglądarki Firefox mają również dwie opcje. W dodatkach Firefoksa wyszukaj TTS, a powinieneś znaleźć „Click Speak”, a także „Text to Voice”. Głosy nie są tak dobre jak głosy Chrome SpeakIt, ale są zdecydowanie użyteczne.
Rozszerzenie SpeakIt wykorzystuje technologię iSpeech, a za cenę 20 USD rocznie witryna może konwertować tekst na pliki audio MP3. Możesz wprowadzać tekst, adresy URL, kanały RSS, a także dokumenty takie jak TXT, DOC i PDF oraz zapisywać je w formacie MP3. Możesz tworzyć podcasty, osadzać audio itp. Oto link i próbka ich dźwięku (nie wiem, jak długo link będzie trwał).
źródło
Pico i espeak są fajne i łatwe do pracy, ale nie są aż tak dobre. Domyślne głosy festiwalowe również nie są tak dobre. Festival to jednak schemat mowy oparty na schemacie, w którym wielu badaczy opracowało znacznie lepsze głosy wtyczek. Możesz łatwo przewyższyć jakość pico2wave na standardowym Ubuntu, ponieważ jeden z tych głosów jest dostępny jako gotowy pakiet.
Aby Festiwal brzmiał naturalnie, oto co zrobić:
Możesz to zrobić z wiersza poleceń, używając
-b
(lub--batch
) i umieszczając każde polecenie w pojedynczym cudzysłowie:Możesz uzyskać inne całkiem dobre głosy z repozytorium Nitech, ale instalacja ich jest skomplikowana, a domyślne ścieżki zmieniają się, więc odniesienia do nazw plików w plikach schematów pakietowych mogą wymagać ręcznej edycji, aby działały na standardowym Ubuntu.
źródło
Prosty Google ™ TTS
Aktualizacja ze strony projektu (2019-02) : Ten projekt jest obecnie nieobsługiwany i pozostanie nim w najbliższej przyszłości
Z powodu braku lepszej alternatywy napisałem skrypt bash, który łączy się ze skryptem perla autorstwa Michała Fapso, aby zapewnić TTS za pośrednictwem Tłumacza Google. Z opisu projektu:
Główne cechy to:
Instalacja i użytkowanie są udokumentowane na stronie projektu .
Byłbym zadowolony, gdybyś spróbował. Zgłoszenia błędów i wszelkie inne opinie są mile widziane!
źródło
Szukałem wysokiego i niskiego poziomu tekstu na mowę dla Ubuntu, która jest wysokiej jakości. Nie ma żadnego. Moje struny głosowe są sparaliżowane, więc potrzebowałem TTS, aby dodać instrukcje głosowe do moich filmów Ubuntu . Można uzyskać wysokiej jakości komercyjny Linux tekstu do mowy oprogramowania tutaj . To jest po prostu bardzo drogie. Ostatecznie kupiłem Natural Reader na Windows (nie działa w Ubuntu pod Wine) za 40 USD. Może później zdobędę Linuksa.
źródło
Prowadzę badania nad najlepiej brzmiącymi i łatwo dostrojonymi głosami tekstu na mowę. Poniżej znajduje się lista 5 najlepszych produktów pod względem jakości dźwięku. Większość stron internetowych powiązanych z tym produktem ma interaktywne demo, które pozwoli ci podjąć własną decyzję.
źródło
Uważam głosy Nitech HTS na festiwalu za bardzo naturalne i pocieszające w porównaniu z innymi głosami, które słyszałem. Zobacz ten link, jak skonfigurować Nitech i inne dźwięki w festiwalu. Nie znalazłem dobrego GUI, którego mogę użyć do skonfigurowania tych głosów, ale ustawienie ich za pomocą festival.scm nadal działa. Ten post jest bardzo stary i możesz znaleźć rzeczywisty katalog instalacyjny za pomocą polecenia „locate festival”
źródło
Połącz narzędzia SVOX (pico) z LibreOffice:
Narzędzia SVOX (pico) są łatwe w instalacji i zapewniają dobrej jakości głosy w Ubuntu. Zainstaluj to:
Możesz używać LibreOffice w połączeniu z narzędziami SVOX (pico), instalując rozszerzenie „Czytaj tekst” i uzyskujesz „GUI” dla tego doskonałego oprogramowania TTS:
Skonfiguruj opcje Read Text Extension za pomocą Narzędzia - Dodatki - Czytaj zaznaczenie .... Użyj / usr / bin / python jako programu zewnętrznego. Wybierz opcję wiersza polecenia, która zawiera token (PICO_READ_TEXT_PY) , możesz chcieć eksperymentować z niektórymi z nich.
Teraz musisz tylko zaznaczyć tekst w LO Writer, Calc, Impress lub Draw i kliknąć ikonę dodaną jako pasek narzędzi (szczęśliwa twarz z balonem).
źródło
Oto, co zrobiłem, aby mieć czystą naturalną mowę dla plików pdf i innych plików tekstowych (inne rozwiązania nie są naturalne lub są to po prostu płatne usługi). To jest właściwie obejście przy użyciu chromu lub chromu, ale działa szybko i łatwo.
Istnieją również sposoby otwierania innych plików, takich jak .doc i .txt w chrome, i rób to samo. Istnieją inne rozszerzenia dla Chrome, które wyświetlają pliki pdf, sprawdź, czy bardziej Ci odpowiada. Poza tym możesz przesyłać wszelkiego rodzaju teksty na Dysk Google i używać SpeakIt! przeczytać to dla ciebie. Inne rozszerzenie o nazwie „Mów tekst” działa w ten sam sposób i ma naturalną mowę.
źródło
Szukając lepszego silnika tts do użycia z nowym trybem narracyjnym Firefoksa 49 , znalazłem pico tts (svox) - mój ulubiony silnik TTS.
Jak zmienić domyślny system całego silnika syntezy mowy?
Ludzie z arch. Linuxa doprowadzili mnie na właściwą ścieżkę:
Odkomentuj moduł, który ci się podoba i ustaw go jako domyślny w ustawieniach dyspozytora mowy:
Uruchom ponownie demona:
ALE, kiedy ponownie uruchamiasz Firefoksa, nic się nie dzieje. Zgodnie z powyższym linkiem (arch forum 10 i 16) działa z festiwalem (nie próbował), ale dyspozytor mowy dla pico nie wyświetla dostępnych głosów. To nie będzie działać.
Każdy pomysł będzie mile widziany ;-)
źródło
Mój ulubiony program zamiany tekstu na mowę nazywa się Magic English, ale podobnie jak Natural Reader wspomniany przez Joe Steigera, jest to program Windows i nie jestem pewien, czy będzie działał pod Wine.
AT&T Natural Voices jest dostępne online jako wersja demonstracyjna, ale jest to raczej obejście niż rozwiązanie ...
źródło
Prosty Google ™ TTS
Pico, mbrola, cmu, festiwal, flite, wszystko SUCK w 2017 roku (były niesamowite w latach 90.). Naturalna mowa AT&T (co jest fantastyczne) nie jest zgodna z Linuksem i nie jest darmowa, dlatego używamy Google
źródło
gTTS
Minusy : tylko CLI. Musisz być online, ponieważ wymaga zgłoszenia do publicznego publicznego punktu końcowego Google.
Stosowanie
Dokumentacja i więcej przykładów
Inne
Niektóre zostały już wspomniane
Naśladować . Instalacja:
eSpeak + Gespeaker (GUI) ( kod źródłowy Gespeaker )
Minusy : stare i brzydkie
źródło
W tym celu buduję Intelligent Speaker - rozszerzenie dla Google Chrome. Może czytać strony nawet bez zaznaczenia (gdy zatrzymanie tekstu jest prawidłowe).
źródło