Jakie są audio odpowiedniki obrazów takich jak „Lena”, „Mandrill” i „Operator”?

Odpowiedzi:

17

Najbliższym przykładem, jaki mogę sobie wyobrazić, jest początek „Tom's Diner” Suzanne Vegi, który został wykorzystany do opracowania warstwy 3 mpeg-1 i nadal jest czasami używany do demonstracji kodeków audio.

fenenety
źródło
3
tak, Tom's Diner to dość czysty (bez pogłosu) i monofoniczny fragment śpiewu, który jest przydatny do testowania programów wykrywających wysokość dźwięku. innym jest klip Boyz II Men z okładki Beatlesów „Yesterday” (na samym końcu). dobre do śledzenia tonu monofonicznego wokalu. to trudniejsze niż Tom's Diner. pamiętam, że używał go Digital Performer.
Robert Bristol-Johnson
16

Przetwarzanie audio jest dużym polem, ale szczególnie w przetwarzaniu mowy szeroko stosowana jest otwarta baza próbek znana jako Harvard Sentences . Zdania Harvarda to zbalansowane fonetycznie zbiory zdań w amerykańskim angielskim. Istnieje wiele równoważnych baz danych dla innych języków.

Aktualne pliki z mową Harvard Sentences można znaleźć tutaj .

Phonon
źródło
5

Myślę również, że baza danych NIST jest bardzo popularna, jeśli chodzi o zadania rozpoznawania mowy. W rzeczywistości jest to standard do porównywania nowych algorytmów i technik podczas corocznych wyzwań.

Dodatkowo MATLAB load handelzawiera fragment GFHandel - Alleluja .

jojek
źródło
2

Nie należy lekceważyć mocy fali sinusoidalnej 1 kHz przy 0 dBFS. W mono. Można przy tym znaleźć wiele rzeczy, które są złe w ścieżkach sygnałowych.

Zbudowałem i skalibrowałem wystarczająco dużo systemów audio, aby dość dokładnie gwizdać 1 kHz. Z prostej pamięci.

Poza tym IGY Donalda Fagena jest tak popularne jako tor testowy, że było zabronione przez wiele festiwali.

mężczyzna z lutownicą
źródło