Chcę przekształcić moje dane tak, aby wariancje były równe jeden, a kowariancje były równe zero (tzn. Chcę wybielić dane). Ponadto średnie powinny wynosić zero.
Wiem, że się tam dostanę, wykonując standaryzację Z i transformację PCA, ale w jakiej kolejności mam to zrobić?
Powinienem dodać, że skomponowana transformacja wybielająca powinna mieć postać .
Czy istnieje metoda podobna do PCA, która wykonuje dokładnie obie te transformacje i daje mi wzór powyższej formy?
pca
linear-algebra
Angelorf
źródło
źródło
Odpowiedzi:
Po pierwsze, otrzymujesz średnią zero, odejmując średniąμ=1N∑x .
Po drugie, otrzymujesz zero kowariancji, wykonując PCA. Jeśli jest macierzą kowariancji twoich danych, to PCA sprowadza się do wykonania kompozycji cyfrowej , gdzie to macierz obrotu ortogonalnego złożona z wektorów własnych i to macierz diagonalna z wartościami własnymi na przekątnej. Matryca daje obrót potrzebny do dekorelacji danych (tj. Odwzorowuje oryginalne cechy na główne komponenty).Σ Σ=UΛU⊤ U Σ Λ U⊤
Po trzecie, po obrocie każdy komponent będzie miał wariancję podaną przez odpowiednią wartość własną. Aby więc wariancje równe , musisz podzielić przez pierwiastek kwadratowy z .1 Λ
Podsumowując, transformacja wybielająca to . Możesz otworzyć nawiasy, aby uzyskać formularz, którego szukasz.x↦Λ−1/2U⊤(x−μ)
Aktualizacja. Zobacz także ten późniejszy wątek, aby uzyskać więcej informacji: Jaka jest różnica między wybielaniem ZCA a wybielaniem PCA?
źródło