Chcę sprawdzić, czy naprawdę zrozumiałem [klasyczną, liniową] analizę czynnikową (FA), zwłaszcza założenia przyjęte przed (i być może po) FA.
Niektóre dane powinny być początkowo skorelowane i istnieje między nimi możliwa liniowa zależność. Po przeprowadzeniu analizy czynnikowej dane są zwykle rozkładane (rozkład dwuwymiarowy dla każdej pary) i nie ma korelacji między czynnikami (wspólnymi i specyficznymi), ani korelacji między zmiennymi z jednego czynnika i zmiennymi z innych czynników.
Czy to jest poprawne?
Binary data should also be avoided
, po co jeszcze możemy zastosować metodę analizy czynnikowejbinary data
?W większości przypadków analiza czynnikowa jest przeprowadzana bez żadnych testów statystycznych per se. Jest o wiele bardziej subiektywny i interpretacyjny niż metody takie jak regresja, modelowanie równań strukturalnych i tak dalej. I generalnie są to testy wnioskowania, które pochodzą z założeń: aby wartości p i przedziały ufności były prawidłowe, założenia te muszą zostać spełnione.
Teraz, jeśli metoda wyboru liczby czynników jest ustawiona na metodę największej wiarygodności, wówczas przyjmuje się założenie, że z tym idzie: że zmienne wprowadzone do analizy czynnikowej będą miały rozkład normalny.
To, że zmienne wejściowe będą miały niezerowe korelacje, jest rodzajem założenia, że bez prawdy wyniki analizy czynnikowej będą (prawdopodobnie) bezużyteczne: żaden czynnik nie pojawi się jako ukryta zmienna za pewnym zestawem zmiennych wejściowych.
O ile „nie ma korelacji między czynnikami (wspólnymi i szczegółowymi) i nie ma korelacji między zmiennymi z jednego czynnika a zmiennymi z innych czynników”, nie są to założenia przyjęte przez analityków czynników, chociaż czasami oba warunki (lub przybliżenie tego) może być pożądane. Ten ostatni, gdy się utrzymuje, jest znany jako „prosta struktura”.
Jest jeszcze jeden warunek, który czasem jest traktowany jako „założenie”: że korelacje rzędu zerowego (waniliowe) między zmiennymi wejściowymi nie są zatapiane przez duże korelacje cząstkowe. W skrócie oznacza to, że relacje powinny być mocne dla niektórych par i słabe dla innych; w przeciwnym razie wyniki będą „mętne”. Jest to związane z celowością prostej struktury i może być faktycznie ocenione (choć nie formalnie „przetestowane”) za pomocą statystyki Kaiser-Meyer-Olkin lub KMO. Wartości KMO w pobliżu .8 lub .9 są zwykle uważane za bardzo obiecujące dla wyników analizy czynnikowej, podczas gdy KMO w pobliżu .5 lub .6 są znacznie mniej obiecujące, a te poniżej .5 mogą skłonić analityka do ponownego przemyślenia swojej strategii.
źródło
Założenia leżące u podstaw eksploracyjnej analizy czynnikowej to:
• Poziom pomiaru przedziału lub stosunku
• Losowe próbkowanie
• Zależność między obserwowanymi zmiennymi jest liniowa
• Rozkład normalny (każda obserwowana zmienna)
• Rozkład normalny dwuwymiarowy (każda para obserwowanych zmiennych)
• Normalność wielowymiarowa
Powyżej od plik SAS
źródło