W jaki sposób „podstawowe twierdzenie analizy czynnikowej” stosuje się do PCA lub jak definiuje się ładunki PCA?

14

Obecnie przeglądam zestaw slajdów, który mam do „analizy czynnikowej” (o ile wiem, PCA).

Wywodzi się w nim „podstawowe twierdzenie analizy czynnikowej”, które twierdzi, że macierz korelacji danych przechodzących do analizy ( ) można odzyskać za pomocą macierzy ładunków czynnikowych ( ):RA

R=AA

To mnie jednak myli. W PCA macierz „ładunków czynnikowych” jest podawana przez macierz wektorów własnych macierzy kowariancji / korelacji danych (ponieważ zakładamy, że dane zostały znormalizowane, są one takie same), przy czym każdy wektor własny jest skalowany tak, aby miał długość pierwsza. Matryca ta jest prostopadła, co , który jest na ogół nie jest równa .AA=IR

użytkownik2249626
źródło
Oprócz odpowiedzi @ amoeba , spójrz w mojej odpowiedzi dotyczącej niejasności terminologicznej. AZe względu na przejrzystość nie polecam nazywać macierzy wektorów własnych (które są ładunkami). Matryca wektorów własnych po prawej stronie jest zwykle oznaczana V(ponieważ R=USV'przez svd), a nie A. Inną równoważną nazwą (pochodzącą od terminologii biplota) dla wektorów własnych są „standardowe współrzędne”, a dla ładunków to „główne współrzędne”.
ttnphns
(„standardowe współrzędne” - ponieważ bezwładność lub skala wartości własnych, to wielkość jednostkowa przy ich wyposażaniu; „główne współrzędne” - ponieważ jest oryginalna pełna wielkość przy ich
wyposażaniu

Odpowiedzi:

17

Jest to rozsądne pytanie (+1), które wynika z terminologicznej dwuznaczności i zamieszania.

W kontekście PCA ludzie często nazywają główne osie (wektory własne macierzy kowariancji / korelacji) „ładunkami”. To jest niechlujna terminologia. To, co raczej powinno się nazywać w PCA „ładunkami”, to osie główne skalowane pierwiastkami kwadratowymi odpowiednich wartości własnych. Wtedy utrzyma się twierdzenie, o którym mówisz.

Rzeczywiście, jeśli rozkład własny macierzy korelacji wynosi gdzie V są wektorami własnymi (osiami głównymi), a S jest diagonalną macierzą wartości własnych, a jeśli zdefiniujemy ładunki jako to łatwo zauważyć, żePonadto, najlepiej rank- przybliżeniem macierzy korelacji jest przez pierwsze obciążeniach PCA:

R=VSV
VS
A=VS1/2,
R=AA.
rr
RArAr.

Proszę zobaczyć moją odpowiedź tutaj, aby uzyskać więcej informacji na temat rekonstrukcji macierzy kowariancji z analizą czynnikową i ładunkami PCA.

ameba mówi Przywróć Monikę
źródło