Czy dopuszczalne jest ładowanie tylko dwóch (lub mniej) pozycji (zmiennych) przez czynnik w analizie czynnikowej?

10

Mam zestaw 20 zmiennych, które poddałem analizie czynnikowej w SPSS. Na potrzeby badań muszę opracować 6 czynników. SPSS wykazał, że 8 zmiennych (spośród 20) zostało załadowanych niską wagą lub zostało obciążonych jednakowo przez kilka czynników, więc je usunąłem. Pozostałe 12 zmiennych zostało załadowanych parami 2 w 6 czynnikach, co jest idealną strukturą - tak jak chciałem, ale teraz jeden ze współpracujących ze mną profesorów chce, żebym znalazł uzasadnienie, dlaczego (lub w jakich warunkach) właściwe jest zachowanie tylko 2 pozycji na czynnik, ponieważ powszechnie wiadomo, że analiza czynnikowa jest użyteczna przy wynikach załadowanych 3 lub więcej pozycji na czynnik.

Czy ktoś może mi pomóc w tym problemie, najlepiej również w opublikowanych źródłach?

Mitja
źródło
Współczynnik pojedynczego elementu jest również akceptowalny, jeśli ten element ma wyższy współczynnik obciążenia.
Meera Gang,
„Przynajmniej 3 elementy na czynnik” to uzasadniona rekomendacja. Jeśli masz po rotacji czynników wyniki z 2 lub jednym elementem w czynniku, albo 1) uzyskaj więcej zmiennych, których spodziewasz się załadować przez ten czynnik, lub 2) powtórz analizę i wyodrębnij mniej czynników lub 3) zostaw wyniki są takie, jakie są, ale nie interpretują czynnika „potrzebującego”, mówiąc „Wierzę, że ten czynnik istnieje, ale ponieważ obecnie nie jest on wystarczająco poparty elementami, pomijam go w interpretacji i wynikach”. Wszystkie te 2 rekomendacje są jednak różne.
ttnphns
Zobacz także, oprócz odpowiedzi tutaj, stats.stackexchange.com/a/198684/3277 (poit 5), dlaczego „Przynajmniej 3 załadowane elementy na czynnik” jest uzasadnionym wymogiem.
ttnphns

Odpowiedzi:

13

Dwie lub trzy pozycje na czynnik to kwestia identyfikacji twojego modelu CFA (FA potwierdzającego).

Załóżmy dla uproszczenia, że ​​model jest identyfikowany poprzez ustawienie wariancji każdego czynnika na 1. Załóżmy również, że nie ma żadnych skorelowanych błędów pomiaru.

Model jednoczynnikowy z dwoma elementami ma dwa ładunki i dwie wariancje błędu do oszacowania = 4 parametry, ale są tylko 3 nietrywialne wpisy w macierzy wariancji-kowariancji, więc nie masz wystarczających informacji, aby oszacować cztery parametry że potrzebujesz.

Model jednoczynnikowy z trzema elementami ma trzy obciążenia i trzy wariancje błędów. Macierz wariancji-kowariancji ma sześć wpisów, a dokładne badanie analityczne pokazuje, że model jest dokładnie zidentyfikowany, i można algebraicznie wyrazić estymaty parametrów jako funkcje wpisów macierzy wariancji-kowariancji. Przy większej liczbie elementów na pojedynczy czynnik masz nadmiernie zidentyfikowany model (więcej stopni swobody niż parametrów), co zwykle oznacza, że ​​jesteś gotowy.

W przypadku więcej niż jednego czynnika model CFA jest zawsze identyfikowany z ponad 3 pozycjami na każdy czynnik (ponieważ dla każdego czynnika identyfikowany jest prosty model pomiaru, więc z grubsza mówiąc można uzyskać prognozy dla każdego czynnika i na tej podstawie oszacować ich kowariancje). Jednak CFA z dwiema pozycjami na czynnik jest identyfikowany, pod warunkiem, że każdy czynnik ma niezerową kowariancję z co najmniej jednym innym czynnikiem w populacji. (W przeciwnym razie omawiany czynnik wypada z systemu, a dwuelementowy model jednoczynnikowy nie jest identyfikowany.) Dowód identyfikacji jest raczej techniczny i wymaga dobrego zrozumienia algebry macierzowej.

Bollen (1989) szczegółowo i dogłębnie omawia kwestie identyfikacji modeli CFA w rozdziale 7. Patrz str. 244 w szczególności w odniesieniu do zasad trzech i dwóch wskaźników.

StasK
źródło
1
To była bardzo trafna odpowiedź. Chciałbym jedynie skomentować (ze względu na PO), że OP zapytał o eksploracyjną FA (EFA). Logiczne jest, że EFA powinna mieć „ponad 3 ładowane elementy na czynnik”, ponieważ CFA tego oczekuje; tylko, że nie powiedziałeś o tym w swojej odpowiedzi.
ttnphns
4

Nigdy nie słyszałem o kryterium „3 pozycje na czynnik”. Odwróciłbym to pytanie i poprosiłbym pana profesora, aby przedstawił solidne odniesienie do tego oświadczenia.

Poza tym „na potrzeby badań muszę opracować 6 czynników”. to dziwna rzecz do powiedzenia.

Podstawowym celem analizy czynnikowej jest 1) ustalenie, ile czynników (często cechy psychiczne) leży u podstaw (większej) liczby mierzonych zmiennych. Następnie 2), w oparciu o ładunki czynnikowe, próbuje się opisać, czym tak naprawdę są te czynniki.

Nie „rozwijasz” 6 czynników, „próbujesz zmierzyć” 6 czynników.

Jednak obecne obciążenia krzyżowe (zmienne ładowane przez kilka czynników) często wskazują, że czynniki „próbują się ze sobą skorelować”. Ma to sens, ponieważ wiemy, że w zasadzie wszystko koreluje ze wszystkim w prawdziwym świecie. Zastosowanie tej obserwacji w analizie za pomocą skośnego (zamiast ortogonalnego varimax) obrotu często pozbywa się wielu obciążeń krzyżowych. IMHO, teoretycznie też brzmi to bardziej.

Daj temu szansę, możesz skończyć z większą liczbą przedmiotów na czynnik. To może (częściowo) rozwiązać również Twój problem.

RubenGeert
źródło
Bardzo dziękuję za komentarz, dlaczego sześć czynników, które mogę wyjaśnić za pomocą modelu, którego używam, mój profesor nie jest przeciwny wyjaśnieniu 6-czynnikowemu, ale chce wyjaśnienia, kiedy można użyć analizy czynnikowej, która zawiera tylko 2 elementy na czynnik . To wciąż pozostaje pytanie.
Mitja
Witamy na stronie @ pythonforspss.org, jest tu wiele dobrych informacji, +1. Kilka uwag: słyszałem już kilka razy, że potrzebujesz co najmniej 3 zmiennych na czynnik, ale nie wiem, jaki jest (lub jeśli faktycznie istnieje) istotny powód tej reguły. Zredagowałem Q OP, aby angielski był płynniejszy; Wstawiam cytowany przez ciebie zwrot, aby zastąpić to, co było wcześniej. To może nie być idealne (nie byłem pewien, jak tłumaczyć to, co, jak sądzę, OP może próbować powiedzieć), ale jeśli tak, to moja wina, a nie Mitja. Pamiętaj, że angielski nie jest pierwszym językiem wielu użytkowników.
Gung - Przywróć Monikę
trzy elementy na czynnik są powszechnym przekonaniem i zwykle powodują problemy na etapie przeglądu (ponieważ jest to powszechne przekonanie). Biorąc to pod uwagę, jeśli twoje społeczności są wysokie (> 0,7), to prawdopodobnie nie masz problemu.
richiemorrisroe
Moje gminy mają 0,5 lub więcej ...
Mitja
factors are "trying to correlate" with each otherjest mistycznym sformułowaniem. Czynniki korelują lub nie korelują w zależności od tego, jak je obracamy (modelujemy). Możliwe są dość wysokie „obciążenia krzyżowe” przy czynnikach ortogonalnych ze zmienną o wysokiej wspólności.
ttnphns
1

Mam teraz ten sam problem. Oto artykuł, który zaleca użycie co najmniej 3 elementów na czynnik. W wyjątkowych przypadkach można jednak użyć elementów według współczynnika (str. 60). http://www.sajip.co.za/index.php/sajip/article/download/168/165 Mój przypadek wydaje się wyjątkowy, ponieważ w moim eksperymencie internetowym są tylko dwie zmienne, które dostarczają informacji na temat gracza strategia i siła strategii. Być może pomoże Ci to również w uzasadnieniu użycia 2 elementów w przypadku niektórych czynników.

eugentango
źródło
1
Ta strona zawiera szereg odnośników obsługujących co najmniej trzy zmienne na regułę czynnikową: encorewiki.org/display/~nzhao/…