Szukam oprogramowania, które pozwoliłoby mi wprowadzić plik audio (.wav .mp3 ...) i wyprowadzić tekst pliku audio.
Czy takie oprogramowanie istnieje? Znalazłem tylko oprogramowanie, które konwertuje (na żywo) głos na tekst, ale nie pliki audio na tekst.
software-rec
audio
speech-to-text
icu222much
źródło
źródło
To nie odpowiada konkretnie na twoje pytanie, ale to, co zrobiłbym w twojej sytuacji, to rozpowszechnianie go jako zadania Amazon Mechanical Turk. Prawdopodobnie uzyskasz najlepsze wyniki i zapłacisz w ten sposób najmniej dolarów.
źródło
eMicrophones tworzy komercyjny produkt o nazwie Windows Speech Recognition Toolkit, który dodaje wiele korzyści do Windows Speech Recognition, w tym możliwość transkrypcji plików * .WAV (pod warunkiem, że pochodzą one od Ciebie, tj. nagranie jakbyś mówił, a nie arbitralny głos) . Z listy funkcji:
źródło
Możesz dodać oprogramowanie VOICENOTE (bezpłatne) do Google Voice. Konwertuje konwersację na tekst. Następnie po prostu odtwórz nagranie głosowe z głośnika bezpośrednio do mikrofonu w VOICENOTE.
Planuję użyć VOICENOTE do transkrypcji moich pisemnych notatek na tekst i zapisania ich w MS Word. Następnie, gdy zapisuję dokument, system Windows może wyszukać moje odręczne notatki na komputerze. W przeciwnym razie odręczne notatki można zapisać tylko jako zdjęcie. Można wyszukiwać tylko tytuły i nie można znaleźć słów dokumentu do wyszukiwania.
źródło
Istnieje projekt oprogramowania o nazwie „fanscribe”, który rozbija nagranie i dzieli je na części, dystrybuując je wśród zainteresowanych osób, które mogą dokonać transkrypcji jego części.
https://github.com/fanscribe/fanscribe/blob/master/README.rst
źródło