Szukam dobrych narzędzi do przetwarzania sygnału audio. np. analiza mowy i muzyki, automatyczna identyfikacja języka itp.
Czy biblioteka Scipy zapewnia funkcje przetwarzania dźwięku? Czy ma dobre narzędzie do przetwarzania sygnału audio?
Czy możesz zasugerować do tego narzędzie?
audio
python
signal-detection
użytkownik1147663
źródło
źródło
Odpowiedzi:
Osobiście uważam, że Python jest jednym z najlepszych dostępnych rozwiązań i zająłem się identyfikacją audio. Zachęcamy do sprawdzenia na przykład mojego oprogramowania do automatycznej identyfikacji ptaków na podstawie głośnych nagrań dźwiękowych: ornitokrity . Z programu korzysta Departament Ochrony Nowej Zelandii i cieszą się z tego. Na podstawie tego przykładu chciałbym wskazać kilka zalet używania Pythona:
Moim drugim wyborem będzie R. Chociaż nie jest tak bogaty w funkcje jak Python, ma wiele przydatnych bibliotek (sprawdź np. Seewave dla swoich aplikacji). Instalacja tych w systemie Windows i Linux to bułka z masłem, co jest ważne, jeśli chcesz, aby inni korzystali z Twojego programu. Jednak z mojego doświadczenia wynika, że wysokowydajne przetwarzanie w języku R jest trudniejsze - ważne jest, aby zauważyć, jeśli trzeba wykonać DUŻO przetwarzania i identyfikacji.
Przykłady klasyfikacji muzyki w Pythonie:
Book Building Machine Learning Systems with Python zawiera rozdział na temat klasyfikacji muzyki
Inne narzędzia (lista nie jest kompletna): Python w muzyce
źródło
Wygląda na to, że Python jest popularnym językiem do tego celu z kilkoma dobrymi zestawami narzędzi, ponieważ dobrze ... Widziałem go w użyciu w niektórych działach i firmach technicznych.
W środowisku akademickim bardzo często obserwuje się tego rodzaju pracę wykonaną w Matlabie, ponieważ łączy on wiele potężnych zestawów narzędzi (przetwarzanie sygnałów, przetwarzanie równoległe, wykresy, narzędzia baz danych, uczenie maszynowe, AI) w łatwym do sondowania środowisku IDE. Jednak kosztuje i ma pewne wady (nie jest to najlepszy język programowania pod względem projektowania aplikacji i wydajności, więc jest to głównie narzędzie do prototypowania, ale można je skompilować do C). Octave to darmowa alternatywa, ale nie mogę ręczyć za jakość narzędzi do przetwarzania sygnału lub samego oprogramowania, ponieważ go nie używałem.
źródło
scipy
ekosystem ma wiele funkcji MATLAB.Możesz także sprawdzić pyAudioAnalysis : łączy otwarte biblioteki do rozpoznawania wzorców i kilka implementacji funkcji audio. Niektóre przykładowe aplikacje zaimplementowane w pyAudioAnalysis , które mogą Cię zainteresować:
źródło
Możesz użyć biblioteki C ++ analizy audio Essentia , która zawiera powiązania Pythona. Skorzystasz ze wszystkich zalet środowiska python / scipy oraz wielu algorytmów analizy dźwięku / muzyki, które są dostarczane z Essentia.
źródło