Obecnie przeglądam zestaw slajdów, który mam do „analizy czynnikowej” (o ile wiem, PCA).
Wywodzi się w nim „podstawowe twierdzenie analizy czynnikowej”, które twierdzi, że macierz korelacji danych przechodzących do analizy ( ) można odzyskać za pomocą macierzy ładunków czynnikowych ( ):
To mnie jednak myli. W PCA macierz „ładunków czynnikowych” jest podawana przez macierz wektorów własnych macierzy kowariancji / korelacji danych (ponieważ zakładamy, że dane zostały znormalizowane, są one takie same), przy czym każdy wektor własny jest skalowany tak, aby miał długość pierwsza. Matryca ta jest prostopadła, co , który jest na ogół nie jest równa .
pca
factor-analysis
terminology
definition
użytkownik2249626
źródło
źródło
A
Ze względu na przejrzystość nie polecam nazywać macierzy wektorów własnych (które są ładunkami). Matryca wektorów własnych po prawej stronie jest zwykle oznaczanaV
(ponieważR=USV'
przez svd), a nieA
. Inną równoważną nazwą (pochodzącą od terminologii biplota) dla wektorów własnych są „standardowe współrzędne”, a dla ładunków to „główne współrzędne”.Odpowiedzi:
Jest to rozsądne pytanie (+1), które wynika z terminologicznej dwuznaczności i zamieszania.
W kontekście PCA ludzie często nazywają główne osie (wektory własne macierzy kowariancji / korelacji) „ładunkami”. To jest niechlujna terminologia. To, co raczej powinno się nazywać w PCA „ładunkami”, to osie główne skalowane pierwiastkami kwadratowymi odpowiednich wartości własnych. Wtedy utrzyma się twierdzenie, o którym mówisz.
Rzeczywiście, jeśli rozkład własny macierzy korelacji wynosi gdzie V są wektorami własnymi (osiami głównymi), a S jest diagonalną macierzą wartości własnych, a jeśli zdefiniujemy ładunki jako to łatwo zauważyć, żePonadto, najlepiej rank- przybliżeniem macierzy korelacji jest przez pierwsze obciążeniach PCA:
Proszę zobaczyć moją odpowiedź tutaj, aby uzyskać więcej informacji na temat rekonstrukcji macierzy kowariancji z analizą czynnikową i ładunkami PCA.
źródło