Analiza czynnikowa kwestionariuszy złożonych z elementów Likerta

17

Kiedyś analizowałem przedmioty z psychometrycznego punktu widzenia. Ale teraz próbuję przeanalizować inne rodzaje pytań dotyczących motywacji i innych tematów. Wszystkie te pytania dotyczą skal Likerta. Moją początkową myślą było zastosowanie analizy czynnikowej, ponieważ hipoteza pytań odzwierciedla niektóre podstawowe wymiary.

  • Ale czy analiza czynnikowa jest odpowiednia?
  • Czy konieczne jest sprawdzenie każdego pytania pod względem jego wymiarów?
  • Czy występuje problem z przeprowadzeniem analizy czynnikowej dla elementów lajkujących?
  • Czy są jakieś dobre artykuły i metody dotyczące przeprowadzania analizy czynnikowej Likerta i innych kategorycznych pozycji?
pbneau
źródło
Jeśli dobrze rozumiem, twoje pytanie obejmuje co najmniej dwa różne tematy: (1) użycie FA w skalach nastawienia lub motywacji oraz (2) jak radzić sobie z „ekstremalnymi” wzorcami odpowiedzi (efekty sufitu / podłogi) w takich skalach?
chl

Odpowiedzi:

22

Z tego, co do tej pory widziałem, FA jest stosowany do elementów postawy, podobnie jak do innych rodzajów skal oceny. Problem wynikający z zastosowanej miary (to znaczy „czy skale Likerta naprawdę należy traktować jako skale numeryczne?” To długotrwała debata, ale pod warunkiem, że sprawdzisz rozkład odpowiedzi w kształcie dzwonu, możesz traktować je jako pomiary ciągłe, w przeciwnym razie sprawdzanie nieliniowych modeli FA lub optymalnego skalowania ) może być obsługiwane przez polimorficzne modele IRT, takie jak stopniowana odpowiedź, skala ratingowa lub częściowy model kredytowy. Te dwa ostatnie można wykorzystać jako zgrubne sprawdzenie, czy odległości progowe, stosowane w elementach typu Likerta, są charakterystyczne dla formatu odpowiedzi (RSM) lub określonego elementu (PCM).

Jeśli chodzi o twój drugi punkt, wiadomo na przykład, że rozkład odpowiedzi w ankietach dotyczących postawy lub zdrowia różni się w zależności od kraju (np. Chińczycy zwracają uwagę na „ekstremalne” wzorce reakcji w porównaniu do tych pochodzących z krajów zachodnich, patrz np. Song , X.-Y. (2007) Analiza wielopróbkowych modeli równań strukturalnych z zastosowaniami do danych o jakości życia, w Handbook of Latent Variable and Related Models , Lee, S.-Y. (red.), Str. 279-302, North -Holandia). Niektóre metody radzenia sobie z taką sytuacją z góry mojej głowy:

  • zastosowanie modeli logarytmiczno-liniowych (podejście marginalne) w celu uwidocznienia silnej nierównowagi między grupami na poziomie pozycji (współczynniki są następnie interpretowane jako ryzyko względne zamiast szans);
  • cytowana powyżej metoda SEM z wieloma próbkami z Song (nie wiem, czy nadal pracują nad tym podejściem).

Chodzi o to, że większość z tych podejść koncentruje się na poziomie przedmiotu (efekt sufitu / podłogi, zmniejszona niezawodność, statystyki niewłaściwego dopasowania przedmiotu itp.), Ale gdy ktoś jest zainteresowany tym, jak ludzie odbiegają od tego, czego można oczekiwać od ideału zestaw obserwatorów / respondentów, myślę, że zamiast tego musimy skupić się na wskaźnikach dopasowania do osoby.

Taki χ2)statystyki są łatwo dostępne dla modeli IRT, takich jak INFIT lub OUTFIT średnia kwadratowa, ale generalnie dotyczą one całego kwestionariusza. Ponadto, ponieważ szacowanie parametrów pozycji opiera się częściowo na parametrach osób (np. W ramach marginalnego prawdopodobieństwa zakładamy rozkład gaussowski), obecność osób odległych może prowadzić do potencjalnie stronniczych szacunków i słabego dopasowania modelu.

Jak zaproponowali Eid i Zickar (2007), połączenie modelu klasy utajonej (w celu wyodrębnienia grupy respondentów, np. Tych, którzy zawsze odpowiadają na skrajne kategorie w porównaniu z innymi) i modelu IRT (w celu oszacowania parametrów pozycji i lokalizacji osób na utajonym cecha w obu grupach) wydaje się być dobrym rozwiązaniem. Inne strategie modelowania opisano w ich pracy (np. Model HYBRID, patrz także Holden i Book, 2009).

Podobnie, modele rozwijające się mogą być wykorzystane do radzenia sobie ze stylem odpowiedzi , który jest zdefiniowany jako spójny i niezależny od treści wzorzec kategorii odpowiedzi (np. Tendencja do zgadzania się ze wszystkimi stwierdzeniami). W naukach społecznych lub literaturze psychologicznej nazywa się to Extreme Response Style (ERS). Odnośniki (1–3) mogą być przydatne, aby dowiedzieć się, w jaki sposób manifestuje się i jak można go zmierzyć.

Oto krótka lista artykułów, które mogą pomóc w postępach w tym temacie:

  1. Hamilton, DL (1968). Atrybuty osobowości związane ze stylem ekstremalnej reakcji . Psychological Bulletin , 69 (3) : 192–203.
  2. Greanleaf, EA (1992). Pomiar stylu ekstremalnej reakcji.Opinia publiczna, kwartalnie , 56 (3) : 328–351.
  3. de Jong, MG, Steenkamp, ​​J.-BEM, Fox, J.-P. i Baumgartner, H. (2008). Wykorzystanie teorii odpowiedzi na przedmiot do pomiaru stylu ekstremalnej reakcji w badaniach marketingowych: globalne dochodzenie.Journal of marketing research , 45 (1) : 104-115.
  4. Morren, M., Gelissen, J. i Vermunt, JK (2009). Radzenie sobie ze stylem ekstremalnej reakcji w badaniach międzykulturowych: Ograniczone podejście do analizy czynników klasy utajonej
  5. Moors, G. (2003). Diagnozowanie zachowania stylu odpowiedzi za pomocą metody czynnika ukrytego. Ponownie zbadano korelacje społeczno-demograficzne postaw płci i postrzegania dyskryminacji etnicznej.Jakość i ilość , 37 (3), 277-302.
  6. de Jong, MG Steenkamp JB, Fox, J.-P. i Baumgartner, H. (2008). Teoria reakcji na przedmiot do zmierzenia stylu ekstremalnej reakcji w badaniach marketingowych: globalne dochodzenie.Journal of Marketing Research , 45 (1), 104-115.
  7. Javaras, KN ​​i Ripley, BD (2007). „Rozkładany” ukryty model zmiennej dla danych o nastawieniu Likerta.JASA , 102 (478): 454–463.
  8. slajdy z Moustaki, Knott i Mavridis, Metody wykrywania wartości odstających w ukrytych modelach zmiennych
  9. Eid, M. i Zickar, MJ (2007). Wykrywanie stylów reakcji i udawanie w ocenach osobowościowych i organizacyjnych przez Mixed Rasch Models. W von Davier, M. i Carstensen, CH (red.), Modele Rasch z rozkładem wielu odmian i mieszanin , str. 255–270, Springer.
  10. Holden, RR and Book, AS (2009). Wykorzystanie hybrydowego modelowania klasowego utajonego Rascha, aby poprawić wykrywanie oszustów w spisie osobowości. Osobowość i różnice indywidualne , 47 (3) : 185–190.
chl
źródło
Zepsute linki do Hamiltona (1968) i Morrena, Gelissena i Vermunta (2009) ... śmiechu! Nie można znaleźć alternatywnych źródeł w Google Scholar (chociaż nie próbowałem jeszcze zwykłego starego Google).
Nick Stauner
13

Eksploracyjna analiza czynnikowa (EFA) jest odpowiednia (psychometrycznie i w inny sposób) do zbadania, w jakim stopniu można wyjaśnić korelacje między wieloma elementami poprzez wywnioskowanie wspólnego wpływu (an) nie mierzonego (tj. Utajonego) czynnika (ów). Jeśli nie jest to twój konkretny zamiar, rozważ alternatywne analizy, np .:

  • Ogólne modelowanie liniowe (np. Regresja wielokrotna, korelacja kanoniczna lub (M) AN (C) OVA)
  • Potwierdzająca analiza czynnikowa (CFA) lub utajone analizy cech / klas / profili
  • Modelowanie równań strukturalnych (SEM) / częściowe modelowanie najmniejszych kwadratów

Wymiarowość to pierwszy problem, którym EFA może się zająć. Możesz zbadać wartości własne macierzy kowariancji (np. Tworząc wykres piargowy za pomocą EFA) i przeprowadzić równoległą analizę w celu ustalenia wymiarów swoich miar. (Zobacz także kilka świetnych porad i alternatywnych sugestii Williama Revelle'a ). Powinieneś to zrobić ostrożnie przed wyodrębnieniem ograniczonej liczby czynników i obróceniem ich w EFA lub przed dopasowaniem modelu z określoną liczbą ukrytych czynników za pomocą CFA, SEM lub jak. Jeśli równoległa analiza wskazuje na wielowymiarowość, ale twój ogólny (pierwszy) czynnik znacznie przewyższa wszystkie inne (tj. Ma zdecydowanie największą wartość własną / wyjaśnia większość wariancji w twoich pomiarach), rozważ analizę dwuskładnikową (Gibbons i Hedeker, 1992;Reise, Moore i Haviland, 2010 ) .

Wiele problemów pojawia się w EFA i modelowaniu współczynnika utajonego ocen skali Likerta. Skale Likerta wytwarzają dane porządkowe (tj. Kategoryczne, wielomianowe, uporządkowane), a nie dane ciągłe. Analiza czynnikowa ogólnie zakłada, że ​​wszelkie surowe dane są ciągłe, a ludzie często przeprowadzają analizy czynnikowe macierzy korelacji iloczynu Pearsona, które są odpowiednie tylko dla danych ciągłych. Oto cytat Reise i współpracowników (2010) :

Zwykłe techniki analityczne z czynnikiem potwierdzającym nie mają zastosowania do danych dychotomicznych lub wielomianowych (Byrne, 2006) . Zamiast tego wymagane są specjalne procedury szacowania (Wirth i Edwards, 2007) . Zasadniczo istnieją trzy opcje pracy z danymi odpowiedzi wielomianowej. Pierwszym z nich jest obliczenie macierzy polichorycznej, a następnie zastosowanie standardowych metod analizy czynnikowej (patrz Knol i Berger, 1991) . Drugą opcją jest zastosowanie analizy czynnikowej pełnej informacji (Gibbons i Hedeker, 1992) . Trzecim jest zastosowanie ograniczonych procedur szacowania informacji zaprojektowanych specjalnie dla uporządkowanych danych, takich jak ważone najmniejsze kwadraty z korektą średniej i wariancji (MPLUS; Muthén i Muthén, 2009) .

Poleciłbym połączenie zarówno pierwszego, jak i trzeciego podejścia (tj. Zastosować ważoną po przekątnej estymację najmniejszych kwadratów na polikorycznej macierzy korelacji), w oparciu o omówienie problemów przez Wanga i Cunninghama (2005) z typowymi alternatywami:

Kiedy przeprowadzono analizę czynnikową potwierdzającą z nietypowymi danymi porządkowymi z maksymalnym prawdopodobieństwem i na podstawie korelacji iloczynu Pearsona z momentem produktu, oszacowania parametrów w dół uzyskane w tym badaniu były zgodne z ustaleniami Olssona (1979) . Innymi słowy, wielkość nietypowości obserwowanych zmiennych porządkowych jest głównym wyznacznikiem dokładności oszacowań parametrów.

Wyniki potwierdzają również ustalenia Babakusa i in. (1987) . Gdy w analizie czynników potwierdzających stosowane jest oszacowanie maksymalnego prawdopodobieństwa z macierzą wejściową korelacji polichorycznej, rozwiązania zwykle powodują niedopuszczalne, a zatem znaczące wartości chi-kwadrat wraz ze słabymi statystykami dopasowania.

Pozostaje pytanie, czy badacze powinni stosować estymatory najmniejszych kwadratów ważone czy ukośne estymatory najmniejszych kwadratów do szacowania modeli równań strukturalnych z nienormalnymi danymi kategorialnymi. Ani ważone oszacowanie najmniejszych kwadratów, ani oszacowanie najmniejszych kwadratów ważonych po przekątnej nie przyjmuje założeń dotyczących charakteru rozkładu zmiennych i obie metody dają asymptotycznie poprawne wyniki. Niemniej jednak, ponieważ szacowane ważenie metodą najmniejszych kwadratów opiera się na momentach czwartego rzędu, takie podejście często prowadzi do problemów praktycznych i jest bardzo wymagające obliczeniowo. Oznacza to, że oszacowanie metodą najmniejszych kwadratów ważonych może być mało wiarygodne, gdy stosuje się je do oceny modeli średnich, tj. Z 10 wskaźnikami, do dużych rozmiarów i małych do średnich rozmiarów próbek.

Nie jest dla mnie jasne, czy to samo dotyczy estymacji metodą najmniejszych kwadratów ważonych dotyczy estymacji DWLS; niezależnie od tego autorzy zalecają ten estymator. Jeśli nie masz jeszcze środków:

  • R (R Core Team, 2012) jest bezpłatny. Będziesz potrzebować starej wersji (np. 2.15.2) Dla tych pakietów:
    • psychPakiet (Revelle 2013) zawiera polychoricfunkcję.
      • Ta fa.parallelfunkcja może pomóc w określeniu liczby czynników do wyodrębnienia.
    • lavaanPakiet (Rosseel 2012) oferty DWLS estymację analizy zmienna ukryta.
    • semToolsPakiet zawiera efaUnrotate, orthRotateoraz oblqRotatefunkcje.
    • Na mirtpakiet (Chalmers 2012) oferty obiecujących alternatyw wykorzystaniem teorii reakcji poz.

Wyobrażam sobie, że Mplus (Muthén i Muthén, 1998-2011) też by działał, ale darmowa wersja demo nie pomieści więcej niż sześciu pomiarów, a wersja licencjonowana nie jest tania. Może jednak warto, jeśli możesz sobie na to pozwolić; ludzie kochają Mplus , a obsługa klienta Muthéns za pośrednictwem forów jest niesamowita!

Jak stwierdzono powyżej, oszacowanie DWLS rozwiązuje problem naruszeń założeń normalności (zarówno jedno-, jak i wielowymiarowych), co jest bardzo częstym problemem i prawie wszechobecnym w danych oceny skali Likerta. Jednak niekoniecznie jest to problem związany z pragmatycznymi konsekwencjami; większość metod nie jest zbyt wrażliwa na (bardzo stronnicze) małe naruszenia (por. Czy testowanie normalności jest „zasadniczo bezużyteczne”? ). Odpowiedź @ chl na to pytanie podnosi także ważniejsze, doskonałe punkty i sugestie dotyczące problemów z ekstremalnym stylem odpowiedzi; zdecydowanie problem z ocenami skali Likerta i innymi subiektywnymi danymi.


Piśmiennictwo
· Babakus, E., Ferguson, JCE i Jöreskog, KG (1987). Wrażliwość analizy potwierdzającego maksymalnego współczynnika prawdopodobieństwa na naruszenia skali pomiarowej i założeń dystrybucyjnych. Journal of Marketing Research, 24 , 222–228.
· Byrne, BM (2006). Modelowanie równań strukturalnych za pomocą EQS. Mahwah, NJ: Lawrence Erlbaum.
· Chalmers, RP (2012). mirt: Wielowymiarowy pakiet teorii odpowiedzi na elementy dla środowiska R. Journal of Statistics Software, 48 (6), 1–29. Źródło: http://www.jstatsoft.org/v48/i06/ .
· Gibbons, RD i Hedeker, DR (1992). Analiza dwuskładnikowa pozycji pełnej informacji. Psychometrika, 57 , 423–436.
· Knol, DL i Berger, MPF (1991). Empiryczne porównanie między analizą czynnikową a wielowymiarowymi modelami reakcji na elementy. Multivariate Behavioural Research, 26 , 457–477.
· Muthén, LK, i Muthén, BO (1998-2011). Podręcznik użytkownika Mplus (wydanie 6). Los Angeles, Kalifornia: Muthén i Muthén.
· Muthén, LK i Muthén, BO (2009). Mplus (wersja 4.00). [Oprogramowanie komputerowe]. Los Angeles, Kalifornia: autor. URL: http://www.statmodel.com .
· Olsson, U. (1979). Oszacowania maksymalnego prawdopodobieństwa dla współczynnika korelacji polichorycznej. Psychometrika, 44 , 443–460.
·Zespół R Core. (2012). R: Język i środowisko dla obliczeń statystycznych. R Foundation for Statistics Computing, Wiedeń, Austria. ISBN 3-900051-07-0, URL: http://www.R-project.org/ .
· Reise, SP, Moore, TM i Haviland, MG (2010). Modele i obroty bifaktorów: badanie stopnia, w jakim dane wielowymiarowe dają wyniki w skali jednoznacznej. Journal of Personality Assessment, 92 (6), 544–559. Źródło: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2981404/ .
· Revelle, W. (2013). psych: Procedury dotyczące osobowości i badań psychologicznych. Northwestern University, Evanston, Illinois, USA. Źródło: http://CRAN.R-project.org/package=psych . Wersja = 1.3.2.
· Rosseel, Y. (2012). lavaan: pakiet R do modelowania równań strukturalnych. Journal of Statistics Software, 48 (2), 1–36. Źródło: http://www.jstatsoft.org/v48/i02/ .
· Wang, WC i Cunningham, EG (2005). Porównanie alternatywnych metod oceny w potwierdzających analizach czynnikowych ogólnego kwestionariusza zdrowia. Raporty psychologiczne, 97 , 3–10.
· Wirth, RJ i Edwards, MC (2007). Analiza czynnikowa pozycji: aktualne podejścia i przyszłe kierunki. Metody psychologiczne, 12 , 58–79. Źródło: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3162326/ .

Nick Stauner
źródło
(+11) Nie wiem, jak przegapiłem twoją odpowiedź!
chl
Ha! Dzięki! Ten od jakiegoś czasu siedzi. Założyłem, że było to trochę za długie lub niejasne, a może polegało na nowych metodach, które były bardziej kontrowersyjne, niż się spodziewałem. Wygląda na to, że jeszcze nie wiedziałem, jak używać tagów w nazwach użytkowników.
Nick Stauner