Szukam niezależnego od głośników programu (komercyjnego lub bezpłatnego), który umożliwiłby mi transkrypcję plików MP3 zawierających nagrania mowy (zwłaszcza podcasty) na tekst. Chciałem wypróbować Dragon Naturally Speaking, ale wygląda na to, że obsługuje tylko transkrypcję własnych nagrań mowy. Jakie są alternatywy?
16
Odpowiedzi:
Dragon Naturally Speaking zaimportuje pliki mp3 i spróbuje je transkrybować. Preferuje dostrojenie rozpoznawania głosu do poszczególnych głośników, ale wykonuje dobrą robotę bez strojenia. Prawdopodobnie najlepiej by było, gdyby Twoje głośniki podcastów brzmiały jak Tom Brokaw.
źródło
Jednym z możliwych rozwiązań byłoby przesłanie filmu na YouTube i wypróbowanie automatycznych napisów, które można włączyć ... nie jest jeszcze zbyt dokładne, ale można pobrać plik z napisami i edytować go samodzielnie, jeśli to pomoże ... jako w przypadku problemów związanych z prawami autorskimi / piractwem możesz ustawić film jako prywatny w swoim profilu, jeśli to w ogóle możliwe?
źródło
Ostrzegam przed wypróbowaniem Dragon Naturally Speaking - napisałem kilka skryptów na moim jailbreakowanym iPhonie, aby skopiować / przekonwertować wszystkie pliki poczty głosowej z mojego telefonu do folderu na komputerze i uruchomiłem przeciwko nim usługę transkrypcji Dragon Naturally Speaking.
Rezultat uruchomienia transkrypcji na plikach z różnymi głośnikami był absolutnie bezużyteczny. Wypróbowałem niektóre alternatywy typu open source, ale rozpoznawanie głosu niezależne od głośników nadal wydaje się ograniczone do bardzo małych słowników.
źródło
Używam http://www.voicebase.com z podcastem i filmami w języku angielskim i działa bardzo dobrze. Jest bezpłatny przez 50 godzin audio.
Możesz pobrać transkrypcję audio na rtf, srt lub pdf.
Możesz pobrać transkrypcje maszynowe około 10-15 minut po przesłaniu, a czasem wcześniej.
źródło
Open Source: CMU Sphinx
Shareware: http://www.e-speaking.com/ (Windows)
Reklama: Dragon NaturallySpeaking (Windows)
Możesz także wypróbować tę metodę, jeśli próbujesz z osx, co można zrobić za pomocą audacity i soundflower
Można również znaleźć kilka odpowiednich linków do opensource. Innym shareware, którego warto spróbować, jest voxcribecc
Jeśli jesteś programistą .net, możesz użyć tej metody do stworzenia własnego zestawu
źródło
Podzinger byłby świetnym rozwiązaniem, ale nie jestem pewien, czy rampa (nowa nazwa firmy, która była EveryZing, która produkowała Podzinger), oferuje już tę usługę za darmo ...
http://en.wikipedia.org/wiki/Podzinger
źródło