Czy można skutecznie zmniejszyć liczbę pozycji w opublikowanej skali Likerta?

11

[zmiany wprowadzone w odpowiedzi na opinie- dzięki :-)]

Doh! Więcej zmian! Przepraszam!

Dzień dobry-

Robię raczej dość przybliżone i gotowe zbieranie danych za pomocą ankiety wysłanej do personelu medycznego przy użyciu opublikowanej skali na temat morale i innych podobnych kwestii.

Jedyną rzeczą jest to, że skala jest dość długa ze wszystkimi innymi rzeczami w ankiecie i chciałbym zmniejszyć jej rozmiar, przecinając każdą podskalę na pół i używając tylko połowy elementów. Moją intuicją jest to, że jest w porządku, ponieważ podskale są ze sobą skorelowane i chociaż nie jest to idealne do badań o standardowej publikacji, jest w porządku tylko dla odrobiny wewnątrzorganizacyjnego ustalenia faktów.

Zastanawiałem się, czy ktoś ma jakieś przemyślenia na temat zasadności robienia tego, pułapek lub czegokolwiek innego. Szczególnie doceniane są referencje, ponieważ moi koledzy będą potrzebować przekonujących!

Wielkie dzięki, Chris B.

edycje

Tak, jest to zwalidowana skala o znanych właściwościach psychometrycznych.

Jest jednowymiarowy i ma podskale, jeśli to właściwy sposób.

Będę pracował na podskali i poziomie całkowitym, a nie przedmiotowym.

30 przedmiotów, prawdopodobnie około 40-60 osób.

Twoje zdrowie!

Chris Beeley
źródło
Czy jest to zwalidowana skala o znanych właściwościach psychometrycznych?
chl
Cześć Chris, więc nie zmniejszasz liczby przedmiotów w skali Likerta, ale raczej używasz mniej pytań / przedmiotów (które są mierzone w skali Likerta). Ogólnie rzecz biorąc, wygląda na to, że zależy to od twoich środków. Możesz sprawdzić korelację przedmiotów, które zamierzasz zdjąć z tymi, które przechowujesz. Ciekawe jest, jak zmierzyć, ile należy usunąć - warto w ten sposób ponownie sformułować pytanie (jeśli nie zrobisz, mogę to zrobić później). Dobre pytanie :)
Tal Galili
Trzy dodatkowe pytania: (1) Czy jest to skala jednowymiarowa, czy istnieje kilka podskal, (2) Jaka jest liczba osób i liczba przedmiotów, oraz (3) Czy pracujesz na poziomie przedmiotów, czy łącznie lub średni wynik?
chl

Odpowiedzi:

11

Chociaż nadal brakuje pewnych informacji (liczba osób i przedmiotów na podskalę), oto kilka ogólnych wskazówek na temat zmniejszania skali. Ponadto, ponieważ pracujesz na poziomie kwestionariusza, nie rozumiem, dlaczego jego długość ma tak duże znaczenie (w końcu podasz tylko statystyki podsumowujące, takie jak wyniki całkowite lub średnie).

Zakładam, że (a) masz zestaw przedmiotów K mierzących jakąś konstrukcję związaną z morale, (b) twoja „jednowymiarowa” skala jest czynnikiem drugiego rzędu, który może być podzielony na różne aspekty, (c) chciałbyś zmniejsz swoją skalę do k <K elementów, aby podsumować z wystarczającą dokładnością łączne wyniki skali podmiotów, zachowując przy tym ważność treści skali.

O ważności treści / konstruktu tej zatwierdzonej skali: Liczba elementów została z pewnością wybrana, aby jak najlepiej odzwierciedlać interesującą konstrukcję. Skracając kwestionariusz, faktycznie zmniejszasz zasięg konstruktu. Dobrze byłoby sprawdzić, czy struktura czynnikowa pozostaje taka sama, biorąc pod uwagę tylko połowę elementów (co może w końcu wpłynąć na sposób ich wyboru). Można tego dokonać za pomocą tradycyjnych technik FA. Ponosisz odpowiedzialność za interpretację skali w duchu podobnym do autorów.

O wiarygodności wyników : Chociaż jest to miara zależna od próby, wiarygodność wyników zmniejsza się przy zmniejszaniu liczby elementów (patrz wzór Spearmana-Browna ); innym sposobem na stwierdzenie, że standardowy błąd pomiaru (SEM) wzrośnie, ale patrz Moduł instruktażowy NCME na temat standardowego błędu pomiaru autorstwa Leo M. Harvilla. Nie trzeba dodawać, że stosuje się do każdego wskaźnika, który zależy od liczby elementów (np. Alfa Cronbacha, którego można użyć do oszacowania jednej formy wiarygodności, a mianowicie wewnętrznej spójności). Mamy nadzieję, że nie wpłynie to na porównania między grupami oparte na surowych wynikach.

Tak więc moje rekomendacje (najprostszy sposób) to:

  1. Wybierz swoje przedmioty, aby zmaksymalizować zasięg konstrukcji; sprawdzić wymiarowość za pomocą FA i pokrycie za pomocą rozkładów odpowiedzi jednoznacznych;
  2. Porównaj średnie korelacje między elementami z wcześniej zgłoszonymi;
  3. Oblicz spójność wewnętrzną dla pełnej skali i swoich kompozytów; sprawdzić, czy są one zgodne z opublikowanymi statystykami w oryginalnej skali (nie trzeba niczego testować, są to środki zależne od próby);
  4. Przetestuj korelacje liniowe (lub polichoryczne lub rangowe) między oryginalnymi i zredukowanymi (pod) wynikami, aby upewnić się, że są one porównywalne (tj. Że poszczególne lokalizacje utajonej cechy nie różnią się w znacznym stopniu, co jest zobiektywizowane przez surowe wyniki );
  5. Jeśli masz zewnętrzną zmienną specyficzną dla przedmiotu (np. Płeć, wiek lub najlepiej miarę związaną z morale), porównaj ważność znanej grupy między tymi dwiema formami.

Trudno byłoby polegać na Teorii Reakcji na Przedmiot, aby wybrać te przedmioty, które niosą maksimum informacji o utajonej skali cech - to tak naprawdę jedno z jej najlepszych zastosowań. Modele dla elementów polimorficznych zostały częściowo opisane w tym wątku, Sprawdzanie poprawności kwestionariuszy .

Zaktualizuj po drugiej aktualizacji

  1. Zapomnij o jakichkolwiek modelach IRT dla przedmiotów z polimotomią z tak małą liczbą tematów.
  2. Analiza czynnikowa będzie również cierpieć z powodu tak małej wielkości próbki; otrzymasz niewiarygodne oszacowania obciążeń czynnikowych.
  3. 30 elementów podzielonych przez 2 = 15 elementów (łatwo jest uzyskać wyobrażenie o wzroście odpowiedniego SEM dla całkowitego wyniku), ale zdecydowanie pogorszy się, jeśli weźmiesz podskale (to było właściwie moje drugie pytanie - Liczba przedmiotów na podskalę, jeśli występuje)
chl
źródło
8

Myślę, że nie ma jednoznacznej odpowiedzi „tak / nie” na twoje pytanie. Jeśli dowolnie upuścisz przedmioty ze skal podskalowych, aby utworzyć krótką formę oryginalnego kwestionariusza, stracisz psychometryczną walidację długiej formy. Rzeczy, które mogą się zmienić, to struktura czynnikowa kwestionariusza, rzetelność podskal, korelacje między przedmiotami a całością itp. (Zauważysz, że jestem przyzwyczajony do klasycznego myślenia w teorii teorii, a nie IRT). Ponadto nie można zastosować żadnej standaryzacji oryginalnego kwestionariusza. Dlatego krótkie formy ustalonych kwestionariuszy muszą przejść osobną fazę walidacji.

Jednak w zależności od wymagań nie wszystko jest stracone. Możesz nie potrzebować standaryzacji, ponieważ możesz chcieć porównać wyniki w próbie bez dokonywania „bezwzględnych” ocen w odniesieniu do populacji referencyjnej. IMHO, to byłby plus, gdybyś miał szansę zweryfikować krótki formularz z oryginalnym formularzem przynajmniej dla podpróbki twojej grupy. Dzięki temu możesz sprawdzić, czy wyniki są podobne.

Ogólnie jednak wyniki kwestionariusza mogą być zaskakująco wrażliwe na jego skład. Ludzie nie wypełniają robotycznie kwestionariuszy, ale dokonują wszelkiego rodzaju milczących założeń i wnioskowania poznawczego: „o co tak naprawdę chodzi?”, „O czym mam tutaj informować?”, „O czym tak naprawdę chcą wiedzieć?”. Na to może mieć duży wpływ dany kontekst przedmiotów, por. Schwarz, N. 1996. Poznawanie i komunikacja: osądy, metody badawcze i logika konwersacji. Mahwah, NJ: Lawrence Erlbaum.

karakal
źródło
4

Dodałbym jeden punkt.

Należy pamiętać o rozróżnieniu między grupą (np. Porównywanie średnich grupowych w czasie) a indywidualnym pomiarem poziomu (np. Korelowanie wyników na skali z innymi skalami na poziomie indywidualnym).

Niezawodność ma odmienne zastosowanie do dwóch poziomów. Być może pomaga następujące uproszczenie:

  • Na wiarygodność pomiaru na poziomie grupy duży wpływ ma liczba uczestników oraz stopień, w jakim istnieje prawdziwa zmienność na poziomie grupy.
  • Na wiarygodność pomiaru na poziomie indywidualnym duży wpływ ma liczba posiadanych przedmiotów i stopień, w jakim poszczególne osoby naprawdę się różnią.
Jeromy Anglim
źródło