W niektórych miejscach czytałem, że muzyka jest próbkowana z częstotliwością 44,1 kHz, podczas gdy słyszymy tylko do 20 kHz. Dlaczego tak
Audio, lub pod względem przetwarzania sygnału, sygnał audio jest analogową lub cyfrową reprezentacją dźwięku, zwykle jako napięcie elektryczne.
W niektórych miejscach czytałem, że muzyka jest próbkowana z częstotliwością 44,1 kHz, podczas gdy słyszymy tylko do 20 kHz. Dlaczego tak
Muszę wykonać korelację krzyżową dwóch plików audio, aby udowodnić, że są one podobne. Wziąłem FFT dwóch plików audio i mam ich wartości widma mocy w osobnych tablicach. Jak powinienem kontynuować ich korelację krzyżową i udowodnić, że są do siebie podobne? Czy jest na to lepszy sposób? Wszelkie...
Rozumiem, że OpenCV to de facto biblioteka do programowania przetwarzania obrazów w C / C ++; Zastanawiam się, czy istnieje biblioteka C lub C ++ do przetwarzania audio. Zasadniczo chcę filtrować nieprzetworzone fale z mikrofonu i analizować je za pomocą niektórych algorytmów uczenia maszynowego....
Chciałbym miksować dwa lub więcej kanałów audio PCM (np. Nagrane próbki) cyfrowo w akustycznie wierny sposób, najlepiej w czasie zbliżonym do rzeczywistego (co oznacza brak lub brak podglądu). Fizycznie „poprawnym” sposobem na to jest zsumowanie próbek. Jednak po dodaniu dwóch dowolnych próbek...
Poniżej znajduje się sygnał reprezentujący nagranie osoby mówiącej. Na tej podstawie chciałbym stworzyć serię mniejszych sygnałów audio. Chodzi o to, aby wykryć, kiedy „ważny” dźwięk zaczyna się i kończy, i użyć ich do markerów do stworzenia nowego fragmentu dźwięku. Innymi słowy, chciałbym użyć...
Studiuję trochę DSP i mam problem ze zrozumieniem różnicy między opóźnieniem fazowym a opóźnieniem grupowym . Wydaje mi się, że oboje mierzą czas opóźnienia sinusoid przechodzących przez filtr. Czy mam rację, myśląc o tym? Jeśli tak, to czym różnią się te dwa pomiary? Czy ktoś mógłby podać...
Szukałem tunera gitarowego w sklepie z aplikacjami na Androida. Znalazłem aplikację tunera, która twierdziła, że jest szybsza niż inne aplikacje. Twierdził, że może znaleźć częstotliwość bez użycia DFT (szkoda, że nadal nie mam adresu URL do tej specyfikacji). Nigdy o tym nie słyszałem. Czy...
Biorąc pod uwagę nagranie, muszę wykryć, czy nastąpiło przycięcie. Czy mogę bezpiecznie stwierdzić, że nastąpiło przycięcie, jeśli jakakolwiek (jedna) próbka osiąga maksymalną wartość próbki, czy też powinienem poszukać serii kolejnych próbek na maksymalnym poziomie? Nagrywanie może być...
To pytanie zostało przeniesione z przepełnienia stosu, ponieważ można na nie odpowiedzieć w procesie przetwarzania stosu wymiany sygnałów. Migrował 7 lat temu . Jestem w stanie napisać podstawowy generator fal sinusoidalnych dla audio, ale chcę, aby mógł płynnie...
Słyszałem, że transformacji Hilberta można użyć do obliczenia obwiedni sygnału. Jak to działa? A czym ta „obwiednia Hilberta” różni się od obwiedni, którą uzyskuje się po prostu prostując sygnał? Interesuje mnie szczególnie znalezienie sposobu na obliczenie obwiedni do zastosowania w kompresji...
Jakiś czas temu próbowałem różnych sposobów rysowania cyfrowych przebiegów , a jedną z rzeczy, które próbowałem, zamiast standardowej sylwetki obwiedni amplitudy, było wyświetlenie jej bardziej jak oscyloskop. Tak wygląda fala sinusoidalna i prostokątna na lunecie: Naiwnym sposobem na to...
Nie wiem, jak nazwać te obrazy, ale bardzo często są one używane w świecie przetwarzania obrazu jako standardowe przykłady pokazujące wyniki konkretnej operacji. Oto link do strony opisującej Lenę jako „standardowy obraz testowy” . Czy istnieją podobne kanoniczne klipy audio wykorzystywane do...
Uszy ludzi słyszą dźwięki o częstotliwościach od 20 Hz do 20 kHz. W oparciu o twierdzenie Nyquista szybkość zapisu powinna wynosić co najmniej 40 kHz. Czy to jest powód wyboru 44,1
Próbuję zaimplementować filtr IIR 8. rzędu, a każda notka aplikacji i podręcznik, który przeczytałem, mówi, że najlepiej jest zaimplementować dowolny filtr rzędu więcej niż 2 jako sekcje drugiego rzędu. Użyłem tf2sosw MATLAB, aby uzyskać współczynniki dla sekcji drugiego rzędu, co dało mi...
Mam zestaw piosenek, dla których wyodrębniłem spektrogram wielkości za pomocą okna Hamminga z 50% nakładką. Po wyodrębnieniu spektrogramu dokonałem pewnej redukcji wymiarowości za pomocą analizy głównych składników (PCA). Po zmniejszeniu go do niższej wymiarowości zrekonstruowałem spektrogramy z...
Dla kogoś, kto ma pewne doświadczenie w tworzeniu oprogramowania, kocha swoje syntezatory i zna [bardzo] podstawy cyfrowej reprezentacji dźwięku, jakie są pierwsze kroki, które powinien wykonać, aby zaprogramować syntezator muzyczny pod względem
Sooo .. Myślałem o tym. Wszyscy wiemy, że brzmi inaczej niż to, co słyszymy z własnego głosu. Łatwo jest dowiedzieć się, jak inni nas słyszą, nagrywając się i słuchając. Ale co na odwrót? Czy istnieje sposób na przekształcenie naszego głosu w taki sposób, aby inni mogli nas usłyszeć, gdy...
W odpowiedzi na moje poprzednie pytanie zastanawiałem się, czy istnieją biblioteki do wykrywania mowy. Przez wykrywanie mowy rozumiem przekazywanie bufora audio i powrót do indeksu, od którego mowa zaczyna się i kończy. Więc jeśli mam 10 sekund próbkowania dźwięku przy 44 kHz, oczekiwałbym szeregu...
Czy ktoś zna filtr tłumiący brak mowy? Piszę oprogramowanie do rozpoznawania mowy i chciałbym odfiltrować wszystko oprócz ludzkiej mowy. Obejmuje to hałas w tle, hałas wytwarzany przez kiepski mikrofon, a nawet muzykę w tle. Zaimplementowałem już filtr pierwszego rzędu, który kompensuje zsuwanie...
Kilka tygodni eksperymentowałem, aby znaleźć sposób na dopasowanie / znalezienie podobnych utworów w bibliotece zawierającej różne gatunki muzyczne. Moja pierwsza próba polegała na wykryciu funkcji takich jak Tempo lub ilości basów w utworach, aby utworzyć grupy, ale nie posunąłem się za daleko z...