Pytania oznaczone «audio»

60

Jeśli ludzie słyszą dźwięk o częstotliwości do 20 kHz, to dlaczego dźwięk muzyki jest próbkowany z częstotliwością 44,1 kHz?

W niektórych miejscach czytałem, że muzyka jest próbkowana z częstotliwością 44,1 kHz, podczas gdy słyszymy tylko do 20 kHz. Dlaczego tak

audio sampling nyquist

58

Jak wdrożyć korelację krzyżową, aby udowodnić, że dwa pliki audio są podobne?

Muszę wykonać korelację krzyżową dwóch plików audio, aby udowodnić, że są one podobne. Wziąłem FFT dwóch plików audio i mam ich wartości widma mocy w osobnych tablicach. Jak powinienem kontynuować ich korelację krzyżową i udowodnić, że są do siebie podobne? Czy jest na to lepszy sposób? Wszelkie...

audio fft waveform-similarity cross-correlation

50

Biblioteka analogiczna do OpenCV do przetwarzania / analizy audio

Rozumiem, że OpenCV to de facto biblioteka do programowania przetwarzania obrazów w C / C ++; Zastanawiam się, czy istnieje biblioteka C lub C ++ do przetwarzania audio. Zasadniczo chcę filtrować nieprzetworzone fale z mikrofonu i analizować je za pomocą niektórych algorytmów uczenia maszynowego....

image-processing audio

49

Algorytm (y) do miksowania sygnałów audio bez obcinania

Chciałbym miksować dwa lub więcej kanałów audio PCM (np. Nagrane próbki) cyfrowo w akustycznie wierny sposób, najlepiej w czasie zbliżonym do rzeczywistego (co oznacza brak lub brak podglądu). Fizycznie „poprawnym” sposobem na to jest zsumowanie próbek. Jednak po dodaniu dwóch dowolnych próbek...

audio algorithms distortion

43

Najprostszy sposób na wykrycie, gdzie zaczynają się i kończą koperty audio

Poniżej znajduje się sygnał reprezentujący nagranie osoby mówiącej. Na tej podstawie chciałbym stworzyć serię mniejszych sygnałów audio. Chodzi o to, aby wykryć, kiedy „ważny” dźwięk zaczyna się i kończy, i użyć ich do markerów do stworzenia nowego fragmentu dźwięku. Innymi słowy, chciałbym użyć...

filters audio filter-design

41

Jaka jest różnica między opóźnieniem fazowym a opóźnieniem grupowym?

Studiuję trochę DSP i mam problem ze zrozumieniem różnicy między opóźnieniem fazowym a opóźnieniem grupowym . Wydaje mi się, że oboje mierzą czas opóźnienia sinusoid przechodzących przez filtr. Czy mam rację, myśląc o tym? Jeśli tak, to czym różnią się te dwa pomiary? Czy ktoś mógłby podać...

filters audio phase group-delay

34

Czy istnieje algorytm znajdowania częstotliwości bez DFT lub FFT?

Szukałem tunera gitarowego w sklepie z aplikacjami na Androida. Znalazłem aplikację tunera, która twierdziła, że jest szybsza niż inne aplikacje. Twierdził, że może znaleźć częstotliwość bez użycia DFT (szkoda, że nadal nie mam adresu URL do tej specyfikacji). Nigdy o tym nie słyszałem. Czy...

audio fft frequency dft

32

Jakie są dobre sposoby na wykrycie przesterowania sygnału w nagraniu?

Biorąc pod uwagę nagranie, muszę wykryć, czy nastąpiło przycięcie. Czy mogę bezpiecznie stwierdzić, że nastąpiło przycięcie, jeśli jakakolwiek (jedna) próbka osiąga maksymalną wartość próbki, czy też powinienem poszukać serii kolejnych próbek na maksymalnym poziomie? Nagrywanie może być...

audio algorithms

27

Jak stworzyć generator fali sinusoidalnej, który może płynnie przechodzić między częstotliwościami

To pytanie zostało przeniesione z przepełnienia stosu, ponieważ można na nie odpowiedzieć w procesie przetwarzania stosu wymiany sygnałów. Migrował 7 lat temu . Jestem w stanie napisać podstawowy generator fal sinusoidalnych dla audio, ale chcę, aby mógł płynnie...

audio

27

Przekształcenie Hilberta w obwiednię sygnału?

Słyszałem, że transformacji Hilberta można użyć do obliczenia obwiedni sygnału. Jak to działa? A czym ta „obwiednia Hilberta” różni się od obwiedni, którą uzyskuje się po prostu prostując sygnał? Interesuje mnie szczególnie znalezienie sposobu na obliczenie obwiedni do zastosowania w kompresji...

audio

27

Obliczanie pliku PDF kształtu fali na podstawie jego próbek

Jakiś czas temu próbowałem różnych sposobów rysowania cyfrowych przebiegów , a jedną z rzeczy, które próbowałem, zamiast standardowej sylwetki obwiedni amplitudy, było wyświetlenie jej bardziej jak oscyloskop. Tak wygląda fala sinusoidalna i prostokątna na lunecie: Naiwnym sposobem na to...

algorithms interpolation audio

21

Jakie są audio odpowiedniki obrazów takich jak „Lena”, „Mandrill” i „Operator”?

Nie wiem, jak nazwać te obrazy, ale bardzo często są one używane w świecie przetwarzania obrazu jako standardowe przykłady pokazujące wyniki konkretnej operacji. Oto link do strony opisującej Lenę jako „standardowy obraz testowy” . Czy istnieją podobne kanoniczne klipy audio wykorzystywane do...

image-processing audio sound

21

Dlaczego wybieramy 44,1 kHz jako częstotliwość próbkowania nagrywania?

Uszy ludzi słyszą dźwięki o częstotliwościach od 20 Hz do 20 kHz. W oparciu o twierdzenie Nyquista szybkość zapisu powinna wynosić co najmniej 40 kHz. Czy to jest powód wyboru 44,1

audio sampling

20

Jak działają kaskadowe sekcje biquad dla filtrów wyższego rzędu?

Próbuję zaimplementować filtr IIR 8. rzędu, a każda notka aplikacji i podręcznik, który przeczytałem, mówi, że najlepiej jest zaimplementować dowolny filtr rzędu więcej niż 2 jako sekcje drugiego rzędu. Użyłem tf2sosw MATLAB, aby uzyskać współczynniki dla sekcji drugiego rzędu, co dało mi...

filters filter-design infinite-impulse-response biquad audio image-processing distance-metrics algorithms interpolation audio hardware performance sampling computer-vision dsp-core music frequency-spectrum matlab power-spectral-density filter-design ica source-separation fourier-transform fourier-transform sampling bandpass audio algorithms edge-detection filters computer-vision stereo-vision filters finite-impulse-response infinite-impulse-response image-processing blur impulse-response state-space linear-systems dft floating-point software-implementation oscillator matched-filter digital-communications digital-communications deconvolution continuous-signals discrete-signals transfer-function image-processing computer-vision 3d

19

Rekonstrukcja sygnału audio z Spectrogram

Mam zestaw piosenek, dla których wyodrębniłem spektrogram wielkości za pomocą okna Hamminga z 50% nakładką. Po wyodrębnieniu spektrogramu dokonałem pewnej redukcji wymiarowości za pomocą analizy głównych składników (PCA). Po zmniejszeniu go do niższej wymiarowości zrekonstruowałem spektrogramy z...

audio spectrogram ifft

19

Co trzeba wiedzieć, aby zbudować syntezator oprogramowania?

Dla kogoś, kto ma pewne doświadczenie w tworzeniu oprogramowania, kocha swoje syntezatory i zna [bardzo] podstawy cyfrowej reprezentacji dźwięku, jakie są pierwsze kroki, które powinien wykonać, aby zaprogramować syntezator muzyczny pod względem

audio

18

Pokaż innym, jak się słyszę

Sooo .. Myślałem o tym. Wszyscy wiemy, że brzmi inaczej niż to, co słyszymy z własnego głosu. Łatwo jest dowiedzieć się, jak inni nas słyszą, nagrywając się i słuchając. Ale co na odwrót? Czy istnieje sposób na przekształcenie naszego głosu w taki sposób, aby inni mogli nas usłyszeć, gdy...

signal-analysis audio transform

18

Biblioteki do wykrywania aktywności głosowej (bez rozpoznawania mowy)

W odpowiedzi na moje poprzednie pytanie zastanawiałem się, czy istnieją biblioteki do wykrywania mowy. Przez wykrywanie mowy rozumiem przekazywanie bufora audio i powrót do indeksu, od którego mowa zaczyna się i kończy. Więc jeśli mam 10 sekund próbkowania dźwięku przy 44 kHz, oczekiwałbym szeregu...

audio speech

17

filtr zakłóceń mowy ludzkiej

Czy ktoś zna filtr tłumiący brak mowy? Piszę oprogramowanie do rozpoznawania mowy i chciałbym odfiltrować wszystko oprócz ludzkiej mowy. Obejmuje to hałas w tle, hałas wytwarzany przez kiepski mikrofon, a nawet muzykę w tle. Zaimplementowałem już filtr pierwszego rzędu, który kompensuje zsuwanie...

filters audio noise speech-recognition

16

Znajdź podobną muzykę za pomocą spektrum FFT

Kilka tygodni eksperymentowałem, aby znaleźć sposób na dopasowanie / znalezienie podobnych utworów w bibliotece zawierającej różne gatunki muzyczne. Moja pierwsza próba polegała na wykryciu funkcji takich jak Tempo lub ilości basów w utworach, aby utworzyć grupy, ale nie posunąłem się za daleko z...

audio fft music