Zmienne skośne w PCA lub analizie czynnikowej

9

Chcę przeprowadzić analizę głównych składników (analizę czynnikową) w SPSS w oparciu o 22 zmienne. Jednak niektóre z moich zmiennych są bardzo wypaczone (skośność obliczona na podstawie zakresów SPSS od 2–80!).

Oto moje pytania:

  1. Czy powinienem zachować zmienne skośne, czy mogę transformować zmienne podczas analizy głównych składników? Jeśli tak, jak interpretowałbym wyniki czynnikowe?

  2. Jaki rodzaj transformacji powinienem zrobić? log10 czy ln?

  3. Pierwotnie moje KMO (Kaiser – Meyer – Olkin) wynosi 0,413. Wiele literatury zaleca minimum 0,5. Czy nadal mogę przeprowadzić analizę czynnikową, czy muszę usunąć zmienne, aby podnieść moje KMO do 0,5?

Meo
źródło
5
Jedna uwaga: PCA to nie to samo, co analiza czynnikowa. PCA jest metodą redukcji danych, FA jest próbą znalezienia ukrytych zmiennych. Często dają (ale nie zawsze) podobne wyniki
Peter Flom

Odpowiedzi:

9
  1. Problem skośności w PCA jest taki sam jak w regresji: dłuższy ogon, jeśli jest naprawdę długi w stosunku do całego zakresu rozkładu, faktycznie zachowuje się jak duża wartość odstająca - pociąga mocno linię dopasowania (główny element w twoim przypadku) mocno w kierunku sam, ponieważ jego wpływ jest wzmocniony; jego wpływ jest wzmocniony, ponieważ jest tak daleki od średniej. W kontekście PCA zezwolenie na bardzo wypaczone zmienne jest dość podobne do robienia PCA bez centrowania danych (tj. Robienia PCA na podstawie macierzy cosinusowej zamiast macierzy korelacji). To Ty decydujesz, czy zezwolić długiemu ogonowi tak bardzo wpływać na wyniki (i pozwolić, aby dane były), czy nie (i przekształcić dane). Problem nie jest związany z interpretacją obciążeń.

  2. Jak chcesz

  3. KMO to indeks, który informuje, czy korelacje częściowe są stosunkowo małe, aby przesłać dane do analizy czynnikowej. Ponieważ w analizie czynnikowej zwykle oczekujemy, że czynnik załaduje więcej niż tylko dwie zmienne. Twoje KMO jest wystarczająco niskie. Można zrobić to lepiej, jeśli spadnie z analizy zmiennych o niskich wartościach poszczególnych KMO (tych postaci przekątnej anty obrazu matrycy, można zażądać, aby pokazać tę macierz w procedurze SPSS Factor). Czy transformowanie zmiennych w mniej wypaczone może odzyskać KMO? Kto wie. Może. Zauważ, że KMO jest ważne głównie w modelu analizy czynnikowej, a nie modelu analizy głównych składników: w FA dopasowujesz korelacje parami, podczas gdy w PCA nie.

ttnphns
źródło
2

+1 do @ttnphns, chcę tylko trochę rozwinąć w punkcie 2. Transformacje są często używane do stabilizacji pochylenia. Jak wskazuje @ttnphns, używałbyś ich przed uruchomieniem analiz. Transformacje logów są częścią rodziny transformacji mocy Box-Coxa. Będziesz chciał rozważyć szerszy zakres możliwych przekształceń niż tylko dzienniki (np. Pierwiastek kwadratowy, odwrotność itp.). Wybór różnych zasad logarytmicznych nie ma wpływu na siłę transformacji. Gdy ludzie zamierzają pracować matematycznie z transformowaną zmienną, czasami preferowane są dzienniki naturalne, ponieważ w niektórych przypadkach dziennik naturalny może zapewnić czystszą matematykę. Jeśli cię to nie obchodzi, możesz wybrać bazę, która ułatwi interpretację. Oznacza to, że wzrost każdej jednostki w nowej skali będzie stanowił podstawę-fold wzrost w oryginalnej skali (np. jeśli użyjesz logarytmicznej bazy 2, wtedy każda jednostka będzie 2-krotnym wzrostem, podstawa 10 oznacza, że ​​każda jednostka będzie 10-krotnym wzrostem itp.), więc może być fajna wybrać bazę, która spowoduje, że dane będą obejmować kilka jednostek w przekształconej skali.

gung - Przywróć Monikę
źródło