Nigdy nie podobało mi się, jak ludzie zazwyczaj analizują dane ze skal Likerta tak, jakby błąd był ciągły i Gaussa, gdy istnieją uzasadnione oczekiwania, że te założenia zostaną naruszone przynajmniej w skrajnych skalach. Co sądzisz o następującej alternatywie:
Jeśli odpowiedź przyjmuje wartość w skali punktowej, rozwiń te dane do prób, z których ma wartość 1, a nk mają wartość 0. Tak więc traktujemy odpowiedź w skali Likerta tak, jakby jest jawną agregacją tajnej serii badań dwumianowych (w rzeczywistości z punktu widzenia kognitywistyki jest to w rzeczywistości atrakcyjny model mechanizmów zaangażowanych w takie scenariusze decyzyjne). Dzięki rozszerzonym danym możesz teraz używać modelu efektów mieszanych, określając respondenta jako efekt losowy (także pytanie jako efekt losowy, jeśli masz wiele pytań) i używając funkcji linku dwumianowego do określenia rozkładu błędów.nk n - k
Czy ktoś może zobaczyć jakiekolwiek naruszenia założeń lub inne szkodliwe aspekty tego podejścia?
źródło
Odpowiedzi:
Nie znam żadnych artykułów związanych z twoim pytaniem w literaturze psychometrycznej. Wydaje mi się, że uporządkowane modele logistyczne uwzględniające komponenty efektów losowych całkiem dobrze poradzą sobie z tą sytuacją.
Zgadzam się z @Srikant i uważam, że proporcjonalny model szans lub uporządkowany model probit (w zależności od wybranej funkcji łącza) może lepiej odzwierciedlać wewnętrzne kodowanie elementów Likerta i ich typowe zastosowanie jako skale ocen w badaniach opinii / postaw lub kwestionariuszach .
Inne alternatywy to: (1) użycie kategorii sąsiadujących zamiast proporcjonalnych lub skumulowanych (w przypadku powiązania z modelami logarytmiczno-liniowymi); (2) zastosowanie modeli odpowiedzi na odpowiedź, takich jak model częściowego kredytu lub model skali ratingowej (jak wspomniano w mojej odpowiedzi dotyczącej analizy skal Likerta ). Ten ostatni przypadek jest porównywalny z podejściem mieszanym, z osobnikami traktowanymi jako efekty losowe, i jest łatwo dostępny w systemie SAS (np. Dopasowanie modeli mieszanych efektów dla powtarzających się wyników porządkowych z zastosowaniem procedury NLMIXED ) lub R (patrz tom. 20 z Urzędowym oprogramowania statystycznego ). Może Cię również zainteresować dyskusja prowadzona przez Johna Linacre na temat optymalizacji skuteczności kategorii skali ocen .
Przydatne mogą być również następujące dokumenty:
źródło
Jeśli naprawdę chcesz zrezygnować z założenia danych na poziomie przedziałów dla skal Likerta, sugerowałbym, aby przyjąć, że dane są uporządkowanym logitem lub probitem. Skale Likerta zwykle mierzą siłę odpowiedzi, a zatem wyższe wartości powinny wskazywać silniejszą odpowiedź na podstawowy przedmiot zainteresowania.
Załóżmy, że masz skalę przedmiotu a reprezentuje nieobserwowaną siłę odpowiedzi na przedmiot zainteresowania. Następnie możesz założyć następujący model odpowiedzi:S.H S
S ≤ α 1y=1 jeśliS≤α1
α H - 1 < S ≤ α H H = 2 , 3 , . . H - 1y=h if dlaαh−1<S ≤αh h=2,3,..H−1
α H - 1 < S < ∞y=H ifαH−1<S< ∞
Zakładając, że ma rozkład normalny z nieznaną średnią i wariancją, dałby uporządkowany model probitowy.S
źródło
Jednym z problemów jest to, że stosując to podejście narzucasz określony związek między średnią a wariancją odpowiedzi. W tego typu ankietach często stosuje się skale Likerta - np. Wybierasz jedną z pięciu kategorii spośród „zdecydowanie zgadzam się” na „zdecydowanie się nie zgadzam” w odniesieniu do niektórych stwierdzeń lub innych - wydaje mi się to niewłaściwe. Na przykład oczekiwałbym, że dziesięciopunktowa skala da mniej więcej taki sam rozkład odpowiedzi jak pięciopunktowa skala, jeśli sąsiednie pary kategorii: dla odpowiedzi wspólnejnp np(1−p) y p
źródło
Możesz użyć dwumianowego przybliżenia w 5-punktowej skali Likerta, jeśli połączysz zgodzić się i zdecydowanie zgodzić się w jednej grupie, a nie zgadzam się i zdecydowanie nie zgadzam się w innej. Oczywiście nadal musisz zdecydować, gdzie idą neutralne. Umieściłbym neutralne w dowolnej grupie, użyłem normalnego przybliżenia dwumianowego (pod warunkiem, że masz więcej niż 40 odpowiedzi) i opracowałem przedziały ufności dla proporcji każdej grupy (zobacz dowolny standardowy tekst statystyczny, jak uzyskać konf. odstępy w proporcjach pochodzących z rozkładu dwumianowego z normalnym przybliżeniem). Następnie umieściłbym neutralne w drugiej grupie i powtórzyłem przedziały ufności. Jeśli wyciągnę ten sam wniosek z obu, to istnieje potencjalny wniosek. W przeciwnym razie nie widzę, jak dwumianowy może być używany z danymi Likerta.
źródło
Jeśli dobrze zrozumiałem, ten artykuł sugeruje bardzo podobne podejście do tego, co opisałeś, sugerując, że tak, w rzeczywistości dane podobne do Likerta mogą powstać z procesu dwumianowego.
Pełny odnośnik: Allik, J. (2014). Model mieszany dwumianowy dla miar osobowości typu Likerta. Frontiers in Psychology , (5) 371
źródło
Właściwie przygotowuję artykuł, w którym wykorzystuję twoje podejście do traktowania odpowiedzi na podobny element, tak jakby to była jawna agregacja ukrytej serii prób dwumianowych.
W moim artykule rozkład dwumianowy jest używany w celu wyjaśnienia kształtu obserwowanych rozkładów częstotliwości. Uzasadnieniem takiego podejścia są dwa założenia. W wielu apletach pokazujących, jak powstaje rozkład dwumianowy, powtarzano niezależne próby Bernoulliego przez pojedynczą kulkę wpadającą przez szereg szpilek. Za każdym razem, gdy piłka spada na sworzeń, odbija się w prawo (tj. Sukces) z prawdopodobieństwem p lub w lewo (tj. Błąd) z prawdopodobieństwem 1-p. Po tym, jak piłka wpadnie przez tablicę, wyląduje w koszu oznaczonym odpowiednią liczbą sukcesów. W mojej pracy proces podejmowania decyzji jest również postrzegany jako seria powtarzanych niezależnych prób Bernoulliego, w których na każdej próbie podmiot decyduje się zgodzić lub nie zgodzić się z danym stwierdzeniem.
(i) Na każdej niezależnej próbie Bernoulliego badany podejmuje decyzję o zgodzie z prawdopodobieństwem p lub nie (nie zgadza się) z prawdopodobieństwem 1-p.
(ii) Jeśli w oświadczeniu dostępnych jest pięć kategorii odpowiedzi, liczba podejmowanych decyzji Bernoulliego dotyczących decyzji o wyrażeniu zgody lub braku zgody (nie zgadzać się) jest równa 4 (5-1).
Ostatecznego wyboru konkretnej kategorii odpowiedzi udzielają następujące zasady.
Jeżeli we wszystkich (czterech) przypadkach zostanie podjęta decyzja Bernoulliego o wyrażeniu zgody, wówczas zostanie udzielona odpowiedź „zdecydowanie się zgadzam”.
Jeżeli w trzech przypadkach zostanie podjęta decyzja o zgodzie Bernoulliego, wówczas zostanie udzielona odpowiedź „zgodzić się”.
Jeżeli w dwóch przypadkach zostanie podjęta decyzja o zgodzie Bernoulliego, zostanie udzielona odpowiedź „niezdecydowana”.
Jeżeli tylko w jednym przypadku zostanie podjęta decyzja Bernoulliego, zostanie udzielona odpowiedź „nie zgadzam się”.
Jeżeli w żadnym przypadku nie zostanie podjęta decyzja Bernoulliego o udzieleniu zgody, zostanie udzielona odpowiedź „zdecydowanie nie zgadzam się”.
Podobne uzasadnienie można podać przy użyciu decyzji „nie zgadzam się”. Aby uzyskać rozkład dwumianowy, punktacja kategorii odpowiedzi jest następująca.
zdecydowanie się nie zgadzam = 0, nie zgadzam się = 1, neutralnie = 2, zgadzam się = 3, zdecydowanie się zgadzam = 4
Te dwa założenia prowadzą do dwumianowego rozkładu częstotliwości odpowiedzi, pod warunkiem, że nie ma systematycznych różnic między respondentami.
Mam nadzieję, że się zgodzisz. Byłbym bardzo wdzięczny, gdybyś mógł poprawić mój angielski w powyższym tekście.
źródło