Usiłuję zrozumieć wyniki analizy głównych składników wykonanych w następujący sposób:
> head(iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
> res = prcomp(iris[1:4], scale=T)
> res
Standard deviations:
[1] 1.7083611 0.9560494 0.3830886 0.1439265
Rotation:
PC1 PC2 PC3 PC4
Sepal.Length 0.5210659 -0.37741762 0.7195664 0.2612863
Sepal.Width -0.2693474 -0.92329566 -0.2443818 -0.1235096
Petal.Length 0.5804131 -0.02449161 -0.1421264 -0.8014492
Petal.Width 0.5648565 -0.06694199 -0.6342727 0.5235971
>
> summary(res)
Importance of components:
PC1 PC2 PC3 PC4
Standard deviation 1.7084 0.9560 0.38309 0.14393
Proportion of Variance 0.7296 0.2285 0.03669 0.00518
Cumulative Proportion 0.7296 0.9581 0.99482 1.00000
>
Wnioskuję z powyższego wyniku:
Proporcja wariancji wskazuje, ile całkowitej wariancji występuje w wariancji określonego głównego składnika. W związku z tym zmienność PC1 wyjaśnia 73% całkowitej wariancji danych.
Pokazane wartości obrotu są takie same jak „obciążenia” wspomniane w niektórych opisach.
Biorąc pod uwagę obroty PC1, można stwierdzić, że Sepal.Length, Petal.Length i Petal.Width są bezpośrednio powiązane i wszystkie są odwrotnie powiązane z Sepal.Width (który ma ujemną wartość w obrocie PC1)
Może występować czynnik w roślinach (jakiś chemiczny / fizyczny układ funkcjonalny itp.), Który może wpływać na wszystkie te zmienne (Sepal.Length, Petal.Length i Petal.Width w jednym kierunku i Sepal.Width w przeciwnym kierunku).
Jeśli chcę pokazać wszystkie obroty na jednym wykresie, mogę pokazać ich względny udział w całkowitej zmienności poprzez pomnożenie każdego obrotu przez proporcję wariancji tego głównego składnika. Na przykład dla PC1 obroty 0,52, -0,26, 0,58 i 0,56 są pomnożone przez 0,73 (wariancja proporcjonalna dla PC1, pokazana w wyniku podsumowania (res)).
Czy mam rację co do powyższych wniosków?
Edytuj w odniesieniu do pytania 5: Chcę pokazać cały obrót na prostym wykresie słupkowym w następujący sposób:
Ponieważ PC2, PC3 i PC4 mają coraz mniejszy wpływ na zmienność, czy sensowne będzie dostosowanie (zmniejszenie) obciążeń zmiennych?
źródło
Odpowiedzi:
prcomp
dokumentacja , choć nie jestem pewien, dlaczego nazywają tę część aspektu „Obrót”, ponieważ implikuje to, że obciążenia zostały obrócone przy użyciu jakiejś ortogonalnej (prawdopodobnej) lub ukośnej (mniej prawdopodobnej) metody.ggplot2
, myślę, że jest to zrobione za pomocąalpha
estetyczne), oparte na proporcji wariancji wyjaśnionej przez każdy składnik (tj. więcej jednolitych kolorów = więcej wyjaśnionych wariancji). Jednak z mojego doświadczenia wynika, że twoja postać nie jest typowym sposobem prezentowania wyników PCA - myślę, że tabela lub dwie (obciążenia + wariancja wyjaśnione w jednym, korelacje składowe w innym) byłyby znacznie prostsze.Bibliografia
Fabrigar, LR, Wegener, DT, MacCallum, RC i Strahan, EJ (1999). Ocena wykorzystania eksploracyjnej analizy czynnikowej w badaniach psychologicznych. Metody psychologiczne , 4 , 272–299.
Widaman, KF (2007). Wspólne czynniki a składniki: zleceniodawcy i zasady, błędy i nieporozumienia . W R. Cudeck i RC MacCallum (red.), Analiza czynnikowa na 100: Historyczne wydarzenia i przyszłe kierunki (s. 177-203). Mahwah, NJ: Lawrence Erlbaum.
źródło
źródło