[zmiany wprowadzone w odpowiedzi na opinie- dzięki :-)]
Doh! Więcej zmian! Przepraszam!
Dzień dobry-
Robię raczej dość przybliżone i gotowe zbieranie danych za pomocą ankiety wysłanej do personelu medycznego przy użyciu opublikowanej skali na temat morale i innych podobnych kwestii.
Jedyną rzeczą jest to, że skala jest dość długa ze wszystkimi innymi rzeczami w ankiecie i chciałbym zmniejszyć jej rozmiar, przecinając każdą podskalę na pół i używając tylko połowy elementów. Moją intuicją jest to, że jest w porządku, ponieważ podskale są ze sobą skorelowane i chociaż nie jest to idealne do badań o standardowej publikacji, jest w porządku tylko dla odrobiny wewnątrzorganizacyjnego ustalenia faktów.
Zastanawiałem się, czy ktoś ma jakieś przemyślenia na temat zasadności robienia tego, pułapek lub czegokolwiek innego. Szczególnie doceniane są referencje, ponieważ moi koledzy będą potrzebować przekonujących!
Wielkie dzięki, Chris B.
edycje
Tak, jest to zwalidowana skala o znanych właściwościach psychometrycznych.
Jest jednowymiarowy i ma podskale, jeśli to właściwy sposób.
Będę pracował na podskali i poziomie całkowitym, a nie przedmiotowym.
30 przedmiotów, prawdopodobnie około 40-60 osób.
Twoje zdrowie!
źródło
Odpowiedzi:
Chociaż nadal brakuje pewnych informacji (liczba osób i przedmiotów na podskalę), oto kilka ogólnych wskazówek na temat zmniejszania skali. Ponadto, ponieważ pracujesz na poziomie kwestionariusza, nie rozumiem, dlaczego jego długość ma tak duże znaczenie (w końcu podasz tylko statystyki podsumowujące, takie jak wyniki całkowite lub średnie).
Zakładam, że (a) masz zestaw przedmiotów K mierzących jakąś konstrukcję związaną z morale, (b) twoja „jednowymiarowa” skala jest czynnikiem drugiego rzędu, który może być podzielony na różne aspekty, (c) chciałbyś zmniejsz swoją skalę do k <K elementów, aby podsumować z wystarczającą dokładnością łączne wyniki skali podmiotów, zachowując przy tym ważność treści skali.
O ważności treści / konstruktu tej zatwierdzonej skali: Liczba elementów została z pewnością wybrana, aby jak najlepiej odzwierciedlać interesującą konstrukcję. Skracając kwestionariusz, faktycznie zmniejszasz zasięg konstruktu. Dobrze byłoby sprawdzić, czy struktura czynnikowa pozostaje taka sama, biorąc pod uwagę tylko połowę elementów (co może w końcu wpłynąć na sposób ich wyboru). Można tego dokonać za pomocą tradycyjnych technik FA. Ponosisz odpowiedzialność za interpretację skali w duchu podobnym do autorów.
O wiarygodności wyników : Chociaż jest to miara zależna od próby, wiarygodność wyników zmniejsza się przy zmniejszaniu liczby elementów (patrz wzór Spearmana-Browna ); innym sposobem na stwierdzenie, że standardowy błąd pomiaru (SEM) wzrośnie, ale patrz Moduł instruktażowy NCME na temat standardowego błędu pomiaru autorstwa Leo M. Harvilla. Nie trzeba dodawać, że stosuje się do każdego wskaźnika, który zależy od liczby elementów (np. Alfa Cronbacha, którego można użyć do oszacowania jednej formy wiarygodności, a mianowicie wewnętrznej spójności). Mamy nadzieję, że nie wpłynie to na porównania między grupami oparte na surowych wynikach.
Tak więc moje rekomendacje (najprostszy sposób) to:
Trudno byłoby polegać na Teorii Reakcji na Przedmiot, aby wybrać te przedmioty, które niosą maksimum informacji o utajonej skali cech - to tak naprawdę jedno z jej najlepszych zastosowań. Modele dla elementów polimorficznych zostały częściowo opisane w tym wątku, Sprawdzanie poprawności kwestionariuszy .
Zaktualizuj po drugiej aktualizacji
źródło
Myślę, że nie ma jednoznacznej odpowiedzi „tak / nie” na twoje pytanie. Jeśli dowolnie upuścisz przedmioty ze skal podskalowych, aby utworzyć krótką formę oryginalnego kwestionariusza, stracisz psychometryczną walidację długiej formy. Rzeczy, które mogą się zmienić, to struktura czynnikowa kwestionariusza, rzetelność podskal, korelacje między przedmiotami a całością itp. (Zauważysz, że jestem przyzwyczajony do klasycznego myślenia w teorii teorii, a nie IRT). Ponadto nie można zastosować żadnej standaryzacji oryginalnego kwestionariusza. Dlatego krótkie formy ustalonych kwestionariuszy muszą przejść osobną fazę walidacji.
Jednak w zależności od wymagań nie wszystko jest stracone. Możesz nie potrzebować standaryzacji, ponieważ możesz chcieć porównać wyniki w próbie bez dokonywania „bezwzględnych” ocen w odniesieniu do populacji referencyjnej. IMHO, to byłby plus, gdybyś miał szansę zweryfikować krótki formularz z oryginalnym formularzem przynajmniej dla podpróbki twojej grupy. Dzięki temu możesz sprawdzić, czy wyniki są podobne.
Ogólnie jednak wyniki kwestionariusza mogą być zaskakująco wrażliwe na jego skład. Ludzie nie wypełniają robotycznie kwestionariuszy, ale dokonują wszelkiego rodzaju milczących założeń i wnioskowania poznawczego: „o co tak naprawdę chodzi?”, „O czym mam tutaj informować?”, „O czym tak naprawdę chcą wiedzieć?”. Na to może mieć duży wpływ dany kontekst przedmiotów, por. Schwarz, N. 1996. Poznawanie i komunikacja: osądy, metody badawcze i logika konwersacji. Mahwah, NJ: Lawrence Erlbaum.
źródło
Dodałbym jeden punkt.
Należy pamiętać o rozróżnieniu między grupą (np. Porównywanie średnich grupowych w czasie) a indywidualnym pomiarem poziomu (np. Korelowanie wyników na skali z innymi skalami na poziomie indywidualnym).
Niezawodność ma odmienne zastosowanie do dwóch poziomów. Być może pomaga następujące uproszczenie:
źródło
Jedno odniesienie, które może ci się przydać:
STANTON, JM, SINAR, EF, BALZER, WK i SMITH, PC (2002), KWESTIE I STRATEGIE OGRANICZANIA DŁUGOŚCI WAGI SAMO RAPORTU. Personnel Psychology, 55: 167–194.
źródło