W jakich warunkach należy stosować skale Likerta jako dane porządkowe lub przedziałowe?

52

Wiele badań w naukach społecznych wykorzystuje skale Likerta. Kiedy należy użyć danych Likerta jako liczby porządkowej, a kiedy należy użyć ich jako danych przedziału czasu?

Lew
źródło
6
Technicznie skale Likerta są sumą elementów typu Likerta i jako takie stanowią rozsądne przybliżenie (przynajmniej według wielu psychometrów w psychologii) punktu danych przedziału.
russellpierce
2
@drknexus - A więc wiele pozycji służy jako triangulacja pomiaru dla skal konstrukcyjnych? Jeśli tak, jakie są kryteria stwierdzenia, że ​​badacz ma wystarczającą liczbę odpowiednich punktów danych (tj. Pozycji), aby użyć skali jako pomiaru interwału?
Lew
2
Nie jestem pewny; to może być godne pytanie dla społeczności w ogóle. Sądzę, że jest to po części ocena wartości ze strony badacza i obszaru. Niektóre obszary są całkowicie skłonne traktować pojedynczy element Likerta jako interwał, mimo że jest to wyraźnie porządek. Rozsądną odpowiedzią może być zastosowanie innej metody analizy, np. Permutacji lub testu ładowania początkowego. Inną odpowiedzią może być przeprowadzenie prostego testu normalności, o ile agregat nie odbiega znacząco od normalności, prawdopodobnie nic ci nie jest.
russellpierce
1
... ale ogólnie wydaje się, że można przywołać centralne twierdzenie graniczne i zasugerować, że 20 do 30 pozycji powinno wystarczyć do zastosowania skali jako pomiaru interwału.
russellpierce

Odpowiedzi:

41

Może za późno, ale i tak dodaję odpowiedź ...

Zależy to od tego, co zamierzasz zrobić z danymi: jeśli chcesz wykazać, że wyniki różnią się przy rozważaniu różnych grup uczestników (płeć, kraj itp.), Możesz traktować swoje wyniki jako wartości liczbowe, pod warunkiem, że spełniają one zwykłe założenia o wariancji (lub kształcie) i wielkości próbki. Jeśli jesteś raczej zainteresowany podkreśleniem, jak wzorce odpowiedzi różnią się między podgrupami, powinieneś rozważyć wyniki pozycji jako dyskretny wybór wśród zestawu opcji odpowiedzi i poszukać logarytmicznego modelowania liniowego, porządkowej regresji logistycznej, modeli odpowiedzi na odpowiedź lub dowolnego innego modelu statystycznego co pozwala poradzić sobie z elementami polimotomicznymi.

Zasadniczo uważa się, że posiadanie 11 różnych punktów na skali jest wystarczające do przybliżenia skali interwałowej (w celu interpretacji patrz komentarz @ xmjx). Pozycje Likerta można uznać za prawdziwą skalę porządkową, ale często są one używane jako wartości liczbowe i możemy obliczyć ich średnią lub SD. Często odbywa się to w badaniach postawy, chociaż rozsądnie jest podać zarówno średnią / SD, jak i% odpowiedzi, np. W dwóch najwyższych kategoriach.

Podczas korzystania ze zsumowanych wyników w skali (tj. Dodajemy wynik do każdego elementu, aby obliczyć „wynik całkowity”), można zastosować zwykłe statystyki, ale należy pamiętać, że pracujesz teraz ze zmienną ukrytą, więc podstawowa konstrukcja powinno mieć sens! W psychometrii zasadniczo sprawdzamy, czy (1) jednorodność skali utrzymuje się, (2) niezawodność skali jest wystarczająca. Porównując dwa takie wyniki skali (dla dwóch różnych instrumentów), możemy nawet rozważyć zastosowanie osłabionych miar korelacji zamiast klasycznego współczynnika korelacji Pearsona.

Klasyczne podręczniki obejmują:
1. Nunnally, JC i Bernstein, IH (1994). Teoria psychometryczna (wydanie 3). McGraw-Hill Series in Psychology.
2. Streiner, DL i Norman, GR (2008). Skale pomiaru zdrowia. Praktyczny przewodnik po ich rozwoju i wykorzystaniu (wydanie czwarte). Oxford
3. Rao, CR i Sinharay, S., Eds. (2007). Handbook of Statistics, Vol. 26: Psychometria . Elsevier Science BV
4. Dunn, G. (2000). Statystyka w psychiatrii . Hodder Arnold.

Możesz także zapoznać się z Zastosowaniami ukrytej cechy i modeli klas ukrytych w naukach społecznych , z Rost & Langeheine, oraz ze strony internetowej W. Revelle na temat badań osobowości .

Podczas walidacji skali psychometrycznej ważne jest przyjrzenie się tak zwanym efektom pułapu / podłogi (duża asymetria wynikająca z oceny uczestników w kategorii najniższej / najwyższej odpowiedzi), która może poważnie wpłynąć na statystyki obliczone przy traktowaniu ich jako zmiennej liczbowej ( np. agregacja kraju, test t). Rodzi to określone problemy w badaniach międzykulturowych, ponieważ wiadomo, że ogólny rozkład odpowiedzi w badaniach dotyczących postawy lub zdrowia różni się w poszczególnych krajach (np. Chińczycy w porównaniu z osobami pochodzącymi z krajów zachodnich zwracają uwagę na specyficzny wzorzec reakcji, przy czym ten pierwszy ma generalnie bardziej ekstremalne wyniki na poziomie przedmiotu, patrz np. Song, X.-Y. (2007) Analiza wielopróbkowych modeli równań strukturalnych z zastosowaniami do danych o jakości życia, wPodręcznik ukrytych zmiennych i modeli pokrewnych , Lee, S.-Y. (Red.), Str. 279-302, Północna Holandia).

Mówiąc bardziej ogólnie, powinieneś spojrzeć na literaturę psychometryczną, która szeroko wykorzystuje przedmioty Likerta, jeśli jesteś zainteresowany kwestią pomiaru. Opracowano różne modele statystyczne, które są obecnie kierowane w ramach Teorii Reakcji na Pozycje.

chl
źródło
2
Tylko dla wyjaśnienia: Nunnally / Bernstein sugerują, aby traktować zmienną jako ciągłą, jeśli ma ona co najmniej 11 odrębnych wartości (s. 115). Skąd ta ogólna zasada „12 punktów implikuje skalę interwałów”?
xmjx,
12

Prosta odpowiedź jest taka, że ​​skale Likerta są zawsze porządkowe. Odstępy między pozycjami na skali są monotoniczne, ale nigdy nie są tak dobrze zdefiniowane, aby były liczbowo jednorodnymi przyrostami.

To powiedziawszy, rozróżnienie między porządkową a interwałem opiera się na specyficznych wymaganiach przeprowadzanej analizy. W szczególnych okolicznościach możesz traktować odpowiedzi tak, jakby padały w skali interwałowej. Aby to zrobić, zwykle respondenci muszą być w ścisłej zgodności co do znaczenia odpowiedzi skali, a analiza (lub decyzje podejmowane na podstawie analizy) powinna być względnie niewrażliwa na pojawiające się problemy.

Tomek
źródło
8
John Tukey napisał inaczej (w 1960 r.) W monografii „Analiza danych i nauka behawioralna” (opublikowanej w Collected Works v. III). Jednym z uzyskanych przez niego wyników jest to, że jeśli osiągasz lepsze wyniki niż około 10% zgodność testu z testem, twoja skala nie jest wystarczająco wąska!
whuber
Ta odpowiedź wydaje się mylić skale Likerta z oryginalnymi pozycjami oceny. Zobacz komentarz @ russellpierce.
rolando2
9

Oprócz tego, co już powiedziano powyżej o skalach sumarycznych, wspomnę również, że problem może się zmienić podczas analizy danych na poziomie grupy. Na przykład, jeśli badałeś

  • zadowolenie z życia stanów lub krajów,
  • zadowolenie z pracy organizacji lub działów,
  • zadowolenie studentów z przedmiotów.

We wszystkich tych przypadkach każda miara zagregowana (być może średnia) opiera się na wielu indywidualnych odpowiedziach (np. N = 50, 100, 1000 itd.). W takich przypadkach oryginalny element Likerta zaczyna nabierać właściwości, które przypominają skalę interwału na poziomie zagregowanym.

Jeromy Anglim
źródło
-2

skala Likerta zawsze w formie porządkowej: Metoda przypisywania wartości ilościowej do danych jakościowych, aby umożliwić jej analizę statystyczną. Wartość liczbowa jest przypisywana do każdego potencjalnego wyboru, a średnia wartość dla wszystkich odpowiedzi jest obliczana na końcu oceny lub ankiety.

mubashara hussain
źródło
5
Witamy na naszej stronie! Proszę przypisać swoją ofertę lub, ogólnie rzecz biorąc, wszelkie słowa, które pożyczasz od kogoś innego.
whuber