Automatyczna normalizacja adaptacyjnego wzmocnienia

1

Jak mogę znormalizować plik (głosowy) audio MP3 lub AAC bez strat, zwiększając wzmocnienie tak bardzo, jak to możliwe (łagodząc zniekształcenia za pomocą kompresora), aby podczas długiej rozmowy ludzie, którzy mówią łagodniej, mogli uzyskać większy zysk dla swojego głosu i ludzie, którzy mówią głośniej, mogą mieć mniejsze zyski?

Eduardo
źródło

Odpowiedzi:

3

Normalizacja przeniesie dźwięk tylko do miejsca, w którym nie będzie zniekształceń. Prawdopodobnie będziesz chciał „zgnieść” dźwięk za pomocą dynamicznej kompresji dźwięku, a następnie zwiększyć wzmocnienie. Kompresja nie jest tak naprawdę bezstratna w tym sensie, że zmieniasz dźwięk i ostatecznie dynamikę.

Kompresor to narzędzie, które włącza się przy określonym progu poziomu dźwięku. Gdy dźwięk przekracza próg (na przykład -12dB), obniża poziom głośniejszych dźwięków o współczynnik (na przykład 2: 1). 2: 1 mówi, że jeśli audio przekroczy próg o 2 dB, wówczas sygnał wyjściowy przekroczy próg o 1 dB. Zwykle można wyrazić wartości ataku i zwolnienia, które określają, jak szybko zmienia się poziom dźwięku w określonej wartości czasu.

Uwaga: kompresja, którą opisałem, jest kompresją w dół. Istnieją również inne typy.

Ogólny poziom dźwięku jest zmniejszony, ponieważ piki są przesuwane w dół, dzięki czemu można zwiększyć wzmocnienie dźwięku w górę, aby uzyskać głośniejszy dźwięk. Kompresor jest cennym, ale łatwo nadającym się do użycia narzędziem (pomyśl o muzyce pop wydanej w ciągu ostatnich 10 lat ...). Musisz przeprowadzić wiele eksperymentów, aby zabrzmiało to poprawnie.

Może być również poprawną opcją zwiększenie głośności w określonych cichszych sekcjach (lub obniżenie głośniejszych sekcji) poprzez rysowanie obwiedni głośności. Ponieważ jest to tylko dźwięk głosowy, nie jestem pewien, czy istnieje konkretna „potrzeba”, aby chcieć zwiększyć ogólną głośność, ale raczej po prostu, aby dźwięk był nieco spójny. Jeśli masz jedną osobę, która jest w stanie mamrotać na początku słowa i krzyczeć na końcu, kompresja jest prawdopodobnie lepszym wyborem.

Nie jestem pewien, jakie narzędzia / system operacyjny masz do dyspozycji, więc ta odpowiedź jest niezależna od narzędzi.

Jesse
źródło
Korzystam z systemu Linux, a narzędzie może używać kompresora
Eduardo
Sam używam Linuksa. Może to być przesada w stosunku do tego, co robisz, ale używam jack (serwer dźwięku), aby skierować wyjście zapału (sekwencer) do jamin (narzędzie masteringowe). Jamin ma wielopasmowy kompresor, co oznacza, że ​​istnieje osobny kompresor dla niskich, średnich i wysokich. Ale prawdopodobnie wystarczy użyć czegoś takiego jak zuchwałość.
Jesse