Właśnie uczyłem się o dziedzinie częstotliwości w obrazach.
Potrafię zrozumieć widmo częstotliwości w przypadku fal. Oznacza to, jakie częstotliwości występują w fali. Jeśli narysujemy widmo częstotliwości , otrzymamy sygnał impulsowy przy i . I możemy użyć odpowiednich filtrów, aby wyodrębnić określone informacje.
Ale co oznacza widmo częstotliwości w przypadku obrazów? Kiedy robimy FFT obrazu w OpenCV, dostajemy dziwne zdjęcie. Co oznacza ten obraz? A jakie jest jego zastosowanie?
Czytam kilka książek, ale zawierają one wiele równań matematycznych, a nie implikacje fizyczne. Czy ktoś może zatem w prosty sposób wyjaśnić domenę częstotliwości w obrazach za pomocą prostej aplikacji w przetwarzaniu obrazów?
image-processing
frequency-spectrum
dft
Abid Rahman K.
źródło
źródło
Odpowiedzi:
„Równania matematyczne” są ważne, więc nie pomijaj ich całkowicie. Ale 2d FFT ma również intuicyjną interpretację. Dla ilustracji obliczyłem odwrotną FFT kilku przykładowych obrazów:
Jak widać, tylko jeden piksel jest ustawiony w dziedzinie częstotliwości. Rezultatem w dziedzinie obrazu (pokazałem tylko rzeczywistą część) jest „obrócony wzór cosinus” (część urojoną byłaby odpowiednia sinus).
Jeśli ustawię inny piksel w dziedzinie częstotliwości (na lewym brzegu):
Dostaję inny wzór częstotliwości 2d.
Jeśli ustawię więcej niż jeden piksel w dziedzinie częstotliwości:
dostajesz sumę dwóch cosinusów.
Tak jak fala 1d, która może być reprezentowana jako suma sinusów i cosinusów, każdy obraz 2d może być reprezentowany (luźno mówiąc) jako suma „obróconych sinusów i cosinusów”, jak pokazano powyżej.
Oznacza amplitudy i częstotliwości sinusów / cosinusów, które po zsumowaniu dają oryginalny obraz.
Naprawdę jest ich zbyt wielu, aby wymienić je wszystkie. Korelację i splot można obliczyć bardzo skutecznie za pomocą FFT, ale to raczej optymalizacja, nie „patrzysz” na wynik FFT. Służy do kompresji obrazu, ponieważ komponenty o wysokiej częstotliwości są zwykle tylko szumem.
źródło
InverseFourier
funkcji Mathematiki . Czy oktawa / matlab nieifft2
robi tego samego?Myślę, że zostało to bardzo dobrze umieszczone w dobrze znanym „przewodniku DSP” ( rozdział 24, sekcja 5 ):
Więc, oczywiście, istnieje pewna struktura i znaczenie za pozornie losowym wzorem uzyskanym przez wykonanie DFT typowego obrazu (takiego jak przykład poniżej), ale nie jest to forma, którą ludzki mózg jest przygotowany do intuicyjnego zrozumienia, przynajmniej jeśli chodzi o percepcję wzrokową.
Oto kolejna interesująca i dość czytelna prezentacja tego, co zawiera transformacja Fouriera obrazu i jak można ją interpretować. Ma serię obrazów, które wyraźnie pokazują, jaka jest zgodność między obrazem transformowanym Fourierem a obrazem oryginalnym.
edytuj: spójrz również na tę stronę , która pokazuje —w końcu ”, w jaki sposób większość ważnych pod względem percepcyjnym informacji na obrazie jest przechowywana w składowej fazowej (kątowej) reprezentacji częstotliwości.
edycja 2: inny przykład znaczenia fazy i wielkości w reprezentacji Fouriera: „Sekcja 3.4.1, Znaczenie fazy i wielkości” podręcznika TU Delft „ Podstawy przetwarzania obrazu ” pokazuje to dość wyraźnie:
źródło
Fala jest falą jednowymiarową; to zależy tylko od . Fala jest falą dwuwymiarową. To zależy od i . Jak widzisz, masz dwie częstotliwości w obu kierunkach.f(t)=cos(ωt) t f(x,y)=cos(ωx+ψy) x y
Dlatego transformacja Fouriera (FFT) da ci , podobnie jak FFT z daje ci . A jeśli twoje wejście jest funkcją sumującą cosinus 2D, to twoja 2D FFT będzie sumą częstotliwości tych cosinusów - znowu bezpośredni analog 1D FFT.cos(ωx+ψy) ω,ψ cos(ωx) ω
źródło
Warto zauważyć, że Analiza Fouriera jest szczególnym przypadkiem pojęcia zwanego funkcjami ortogonalnymi . Podstawową ideą jest rozbicie skomplikowanego sygnału na liniową superpozycję prostszych funkcji „podstawowych”. Możesz wykonać przetwarzanie lub analizę na podstawie funkcji podstawowych, a następnie zsumować wyniki dla funkcji podstawowych, aby uzyskać wynik dla oryginalnego sygnału.
Aby to zadziałało, istnieją pewne matematyczne wymagania dla funkcji bazowych, tj. Idealnie tworzą one bazę ortonormalną. W przypadku transformacji Fouriera podstawowymi funkcjami są złożone wykładnicze. Istnieje jednak wiele innych funkcji, których można również użyć.
źródło
Na obrazach zwiększenie częstotliwości wiąże się z bardziej nagłymi przejściami jasności lub koloru. Co więcej, szum jest zwykle osadzony w górnej części widma, więc do redukcji szumów można zastosować filtr dolnoprzepustowy.
źródło
w tym kontekście bardzo ładne demo: http://bigwww.epfl.ch/demo/basisfft/index.html
źródło