Wszystkie typowe funkcje okna innego niż prostokątne wydają się być symetryczne. Czy zdarza się, że przed FFT ktoś chciałby użyć niesymetrycznej funkcji okna? (Powiedz, czy dane po jednej stronie przysłony FFT były uważane za nieco ważniejsze niż dane po drugiej lub mniej zaszumione itp.)
Jeśli tak, jakie rodzaje asymetrycznych funkcji okna zostały zbadane i jak wpłynęłyby one na odpowiedź częstotliwościową w porównaniu z (bardziej stratnym?) Offsetowym oknem symetrycznym?
fft
fourier-transform
window-functions
hotpaw2
źródło
źródło
Odpowiedzi:
Użyję okna skrótu do „funkcji okna”.
W przypadku audio każde przetwarzanie, które tworzy coś w rodzaju wstępnego dzwonienia lub echa, będzie brzmiało powolnie jak mp3 o niskiej przepływności. Dzieje się tak, gdy zlokalizowana energia stanu przejściowego lub impulsu rozkłada się w czasie, na przykład przez modyfikację danych widmowych w transformowanych zakładkach, takich jak modyfikowana dyskretna dyskretna transformacja kosinusowa (MDCT). W takim przetwarzaniu dźwięk jest okienkowany przez nakładające się okna analizy , transformowany, przetwarzany w dziedzinie częstotliwości (jak dane skompresowane do mniejszej przepływności), ponownie okienkowany za pomocą okna syntezy i sumowany z powrotem. Iloczyn okna analizy i syntezy musi być taki, aby nakładające się okna sumowały się do jedności.
Tradycyjnie używane funkcje okna były symetryczne, a ich szerokość była kompromisem między selektywnością częstotliwości (długie okno) a unikaniem artefaktów w dziedzinie czasu (krótkie okno). Im szersze okno, tym więcej czasu w czasie przetwarzanie może rozprzestrzenić sygnał. Nowszym rozwiązaniem jest zastosowanie okna asymetrycznego. Dwa użyte okna mogą być wzajemnie odbiciami lustrzanymi. Okno analizy spada od szczytu do zera szybko, dzięki czemu impulsy nie są „wykrywane” z dużym wyprzedzeniem, a okno syntezy rośnie od zera do szczytu szybko, tak że efekty jakiegokolwiek przetwarzania nie rozprzestrzeniają się znacznie w czasie. Kolejną zaletą tego jest małe opóźnienie. Asymetryczne okna mogą mieć dobrą selektywność częstotliwości i mogą zastąpić symetryczne okna o zmiennej wielkości w kompresji audio, jak rodzaj lekarstwa. WidziećM. Schnell, M. Schmidt, M. Jander, T. Albert, R. Geiger, V. Ruoppila, P. Ekstrand, M. Lutzky, B. Grill, „MPEG-4 Enhanced Low Delay AAC - nowy standard wysokich komunikacja wysokiej jakości ” , 125. konwencja AES, San Francisco, Kalifornia, USA, przedruk 7503, październik 2008 r oraz inny dokument konferencyjny, w którym pokazują one także wielkość transformaty Fouriera ich okna: Schnell, M., i in. 2007. Ulepszony AEG MPEG-4 o niskim opóźnieniu - komunikacja wysokiej jakości o niskiej przepływności. W 122. konwencji AES .
Ryc. 1. Ilustracja zastosowania okien asymetrycznych w analizie syntezy w analizie docierania. Iloczyn (czarny przerywany) okna analizy (niebieski) i okna syntezy (żółtawy pomarańczowy) sumuje się do jedności z oknem z poprzedniej ramki (szary przerywany). Konieczne są dalsze ograniczenia, aby zagwarantować idealną rekonstrukcję podczas korzystania z MDCT.
Zamiast MDCT można zastosować dyskretną transformatę Fouriera (DFT, FFT), ale w takich kontekstach da redundantne dane widmowe. W porównaniu do DFT, MDCT daje tylko połowę danych spektralnych, a jednocześnie umożliwia doskonałą rekonstrukcję, jeśli zostaną wybrane odpowiednie okna.
Oto mój własny asymetryczny projekt okna (ryc. 2) odpowiedni do analizy syntezy w trybie analizy z wykorzystaniem DFT, ale nie MDCT, dzięki której nie zapewnia idealnej rekonstrukcji. Okno próbuje zminimalizować iloczyn średnich kwadratowych pasm czasu i częstotliwości (podobnie do ograniczonego okna Gaussa ), zachowując niektóre potencjalnie przydatne właściwości w dziedzinie czasu: nieujemne, jednomodalne ze szczytem w „czasie zero”, wokół którego analiza i synteza okna to wzajemne odbicie lustrzane, funkcja i ciągłość pierwszej pochodnej, zero-średnia, gdy kwadrat funkcji okna jest interpretowany jako nienormalizowana funkcja gęstości prawdopodobieństwa. Okno zostało zoptymalizowane za pomocą ewolucji różnicowej .
Ryc. 2. Po lewej: Asymetryczne okno analizy odpowiednie do nakładania się analizy-przetwarzania-resyntezy wraz z jego odwróconym w czasie oknem syntezy. Po prawej: okno Cosinus, z takim samym opóźnieniem jak okno asymetryczne
Ryc. 3. Wielkość przekształceń Fouriera okna cosinus (niebieskiego) i okna asymetrycznego (pomarańczowego) z ryc. 2. Okno asymetryczne pokazuje lepszą selektywność częstotliwości.
Oto kod źródłowy Octave dla wykresów i okna asymetrycznego. Kod kreślenia pochodzi z Wikimedia Commons . W systemie Linux zalecam instalowanie
gnuplot
,epstool
,pstoedit
,transfig
przedelibrsvg2-bin
do oglądania użyciudisplay
.Możesz użyć tylko co drugą próbkę okna, ponieważ zaczyna się ona od zera. Poniższy kod C ++ robi to za Ciebie, więc nie dostajesz żadnych zerowych próbek, z wyjątkiem jednej czwartej okna, która jest wszędzie zerowa. Dla okna analizy jest to pierwszy kwartał, a dla okna syntezy - ostatni kwartał. Druga połowa okna analizy powinna być wyrównana z pierwszą połową okna syntezy w celu obliczenia ich produktu. Kod testuje również średnią okna (jako funkcję gęstości prawdopodobieństwa) i pokazuje płaskość nakładającej się rekonstrukcji.
A kod źródłowy funkcji kosztu optymalizacji do użycia z Kiss FFT i biblioteką optymalizacji :
źródło
To zależy od kontekstu okienkowania. Tradycyjnie opracowane okienkowanie było przeznaczone dla metody szacowania gęstości widmowej mocy Blackmana-Tukeya. Jest to ogólna forma metod korelogramu, w której wykorzystuje się twierdzenie Wienera-Khinchina o czasie dyskretnym. Przypomnijmy, że wiąże to sekwencję autokorelacji z gęstością widmową mocy w dyskretnym czasie transformaty Fouriera.
Dlatego okna zostały zaprojektowane z uwzględnieniem kilku kryteriów. Po pierwsze, musieli mieć zysk jedności u źródła. Miało to na celu zachowanie mocy w sekwencji autokorelacji sygnału, ponieważ rxx [0] można traktować jako moc próbki. Następnie okno powinno zwężać się od początku. Jest to z wielu powodów. Po pierwsze, aby być prawidłową sekwencją autokorelacji, wszystkie inne opóźnienia muszą być mniejsze lub równe początkowi. Po drugie, pozwoliło to na wyższą wagę niższych opóźnień, które zostały obliczone z dużą pewnością przy użyciu większości próbek, oraz małą lub zerową wagę wyższych opóźnień, które mają rosnącą wariancję ze względu na malejącą liczbę próbek danych dostępnych dla ich obliczenie. To ostatecznie skutkuje szerszym płatem głównym, a następnie zmniejszoną rozdzielczością w oszacowaniu PSD,
Wreszcie jest również wysoce pożądane, jeśli okna mają nieujemne spektrum. Wynika to z faktu, że w metodzie Blackmana-Tukeya można myśleć o odchyleniu ostatecznego oszacowania jako o rzeczywistej gęstości widmowej mocy splecionej z widmem okna. Jeśli to okno ma regiony ujemne, możliwe jest, że w oszacowaniu gęstości widmowej mocy znajdują się regiony ujemne. Jest to oczywiście niepożądane, ponieważ w tym kontekście ma niewielkie znaczenie fizyczne. Ponadto zauważysz, że w metodzie Blackmana-Tukeya nie ma operacji kwadratu wielkości. Wynika to z faktu, że przy rzeczywistej i parzystej sekwencji autokorelacji pomnożonej przez rzeczywiste i równe okno, dyskretna transformata Fouriera będzie również rzeczywista i parzysta. W praktyce znajdziesz bardzo małe ujemne składniki, które zwykle są kwantyzowane.
Z tych powodów okna mają również nieparzystą długość, ponieważ wszystkie prawidłowe sekwencje autokorelacji są również. Teraz to, co wciąż można zrobić (i zrobić), jest w kontekście metod periodogramu. Oznacza to, że należy okienkować dane, a następnie wziąć do kwadratu wielkość okienkowanych danych. Nie jest to równoważne z metodą Blackmana-Tukeya. Na podstawie niektórych pochodnych statystycznych można stwierdzić, że zachowują się one średnio podobnie , ale ogólnie nie. Na przykład dość często stosuje się okienkowanie dla każdego segmentu w metodzie Welcha lub Bartletta, aby zmniejszyć wariancję oszacowań. Zasadniczo dzięki tym metodom motywacja jest częściowo taka sama, ale inna. Moc jest znormalizowana w tych metodach, dzieląc na przykład energię okna, zamiast ostrożnego ważenia opóźnień okna.
Mamy więc nadzieję, że to kontekstualizuje okna i ich pochodzenie oraz dlaczego są one symetryczne. Jeśli zastanawiasz się, dlaczego można wybrać okno asymetryczne, zastanów się nad implikacjami właściwości dualności transformacji Fouriera i tym, co oznacza splot oszacowania gęstości widmowej mocy dla twojego zastosowania. Twoje zdrowie.
źródło
Pierwotnym punktem okienkowania jest upewnienie się, że (zakładany okresowo przez DFT) sygnał nie ma ostrych stanów przejściowych na początku w porównaniu do końca. Kosztem jest to, że częstotliwości w kierunku środka okna (symetrycznego) będą bardziej ważone i przedstawione w kolejnym DFT.
Mając to wszystko w tle, mogę sobie wyobrazić, że można by użyć asymetrycznego okna, aby zaakcentować lokalne cechy czasowe w analizowanym sygnale za pomocą DFT. Może to jednak nastąpić kosztem szerszej szerokości płata podczas DFT, jeśli punkty końcowe twojego sygnału nie będą w przybliżeniu tej samej amplitudy po okienkowaniu.
źródło