Kiedy powinienem obliczyć PSD zamiast zwykłego widma wielkości FFT?

12

Mam trzydziestosekundowy sygnał mowy, który był próbkowany z częstotliwością 44,1 kHz. Teraz chciałbym pokazać, jakie częstotliwości ma mowa. Nie jestem jednak pewien, jaki byłby to najlepszy sposób. Wydaje się, że czasami oblicza się wartość bezwzględną transformaty Fouriera, a czasem gęstość widmową mocy. Jeśli dobrze rozumiem, to drugie działa tak, że dzielę sygnał na części, wykonuję FFT część po części i jakoś sumuję. Funkcje okna są w jakiś sposób zaangażowane. Czy możesz mi to trochę wyjaśnić? Jestem nowy w DSP.

spede
źródło
1
Podział sygnału na segmenty, znalezienie widma każdego z nich, a następnie uśrednienie widm może pomóc w redukcji szumów, ale także zmniejsza rozdzielczość. patrz en.wikipedia.org/wiki/Welch%27s_method
endolith

Odpowiedzi:

8

Teraz chciałbym pokazać, jakie częstotliwości ma mowa. Nie jestem jednak pewien, jaki byłby to najlepszy sposób. Wydaje się, że czasami oblicza się wartość bezwzględną transformaty Fouriera, a czasem gęstość widmową mocy.

Jeśli chcesz nadać swojemu analizie znaczenie fizyczne, wybierz gęstość widmową mocy (PSD). Dzieje się tak, ponieważ daje to po prostu moc twojego sygnału w każdym paśmie częstotliwości. Z drugiej strony, jeśli nie chcesz / nie troszczysz się o fizyczne znaczenie, ale chcesz wiedzieć, jak amplitudy czterech pasm każdego pasma różnią się względem siebie, możesz trzymać się absolutnej wielkości.

x[n]X(fa)|X(fa)||X(fa)|2)

Jeśli dobrze rozumiem, to drugie działa tak, że dzielę sygnał na części, wykonuję FFT część po części i jakoś sumuję. Funkcje okna są w jakiś sposób zaangażowane. Czy możesz mi to trochę wyjaśnić? Jestem nowy w DSP.

Nie, to nie jest prawda. To, o czym tu mówisz, odnosi się do krótkotrwałej transformacji Fouriera (STFT). Jest to po prostu odcięcie sygnału w dziedzinie czasu, poszerzenie go, a następnie przyjęcie czteroczęściowego trnasformu. Pod koniec dnia nadal będziesz mieć złożoną matrycę. Jeśli zdecydujesz się przyjąć jego bezwzględną wielkość, będziesz mieć bezwzględną macierz transformacji Fouriera. Jeśli weźmiesz jego bezwzględną wielkość do kwadratu, otrzymasz macierz gęstości widmowej mocy.

Tarin Ziyaee
źródło
3

Ważne jest, aby zrozumieć coś takiego jak sygnał mowy, ponieważ jego składniki częstotliwości zmieniają się w czasie . Aby przedstawić mowę w dziedzinie częstotliwości, zwykle bierzemy wystarczająco krótkie okno sygnału, w którym możemy założyć, że widmo mowy nie zmienia się znacząco (zwykle 10 ms). Tak więc obliczamy widmo mocy dla każdego kolejnego okna 10 ms za pomocą STFT (często z pewnym nakładaniem się okien) i traktujemy każde kolejne widmo jako „migawkę” składników częstotliwości mowy w danym momencie. Często kolejne widma są wykreślane na wykresie 3D, takim jak spektrogram, z czasem na osi X, częstotliwością na osi Y i wielkością wykreśloną jako intensywność fałszywego koloru lub skali szarości w każdej lokalizacji X, Y.

Paul R.
źródło