Według The SAGE Encyclopedia of Social Science Research Methods …
[a] efekt pułapu występuje, gdy miara ma wyraźną górną granicę potencjalnych odpowiedzi, a duża koncentracja uczestników osiąga ten lub zbliżony poziom. Tłumienie skali jest problemem metodologicznym, który pojawia się, gdy wariancja jest ograniczona w ten sposób. … Na przykład może wystąpić efekt pułapu przy pewnej mierze postaw, w których wysoki wynik wskazuje na przychylne nastawienie, a najwyższa odpowiedź nie pozwala uchwycić najbardziej pozytywnej oceny. … Najlepszym rozwiązaniem problemu efektów sufitowych są testy pilotażowe, które pozwalają wcześnie zidentyfikować problem . W przypadku znalezienia efektu pułapu [i] miarą wynikową jest wykonanie zadania, zadanie może być trudniejsze w celu zwiększenia zakresu potencjalnych reakcji. 1 [podkreślenie dodane]
Wydaje się, że wiele z rad i pytań ( i tutaj ) zajmujące się analizowaniem danych, które pokazują efekty sufitowe podobne do opisanego w powyższym cytatem.
Moje pytanie może być proste lub naiwne, ale w jaki sposób można wykryć, że w danych występuje efekt pułapu? Mówiąc dokładniej, powiedzmy, że utworzono test psychometryczny i podejrzewa się, że prowadzi on do efektu pułapu (tylko badanie wizualne), a następnie test jest weryfikowany w celu uzyskania większego zakresu wartości. Jak można wykazać, że poprawiony test usunął efekt pułapu z generowanych danych? Czy istnieje test, który pokazuje, że występuje efekt pułapu w zestawie danych a brak efektu pułapu w zestawie danych b ?
Moim naiwnym podejściem byłoby po prostu zbadanie przekrzywienia rozkładu, a jeśli nie jest ono przekrzywione, do wniosku, że nie ma efektu pułapu. Czy to zbyt uproszczone?
Edytować
Aby dodać bardziej konkretny przykład, powiedzmy, że opracowuję instrument, który mierzy pewną ukrytą cechę x, która rośnie wraz z wiekiem, ale ostatecznie wyrównuje się i zaczyna maleć w starszym wieku. Robię pierwszą wersję, która ma zakres od 1 do 14, przeprowadzam pilotowanie i stwierdzam, że wydaje się, że może istnieć efekt pułapu (duża liczba odpowiedzi w okolicach 14, maksimum, maksimum .. Podsumowuję to tylko patrząc na dane. Ale dlaczego? Czy istnieje jakaś rygorystyczna metoda poparcia tego twierdzenia?
Następnie poprawiam miarę, aby mieć zakres 1–20 i zbieram więcej danych. Widzę, że trend bardziej odpowiada moim oczekiwaniom, ale skąd mam wiedzieć, że zakres pomiaru jest wystarczająco duży. Czy muszę to ponownie zmienić? Wizualnie wydaje się być w porządku, ale czy istnieje sposób przetestowania go, aby potwierdzić moje podejrzenia?
Chcę wiedzieć, jak mogę wykryć ten efekt pułapu w danych, a nie tylko na nie patrzeć. Wykresy przedstawiają rzeczywiste dane, a nie teoretyczne. Poszerzenie zakresu instrumentu zapewniło lepszy rozkład danych, ale czy to wystarczy? Jak mogę to przetestować?
1 Hessling, R., Traxel, N., i Schmidt, T. (2004). Efekt sufitowy. W Michael S. Lewis-Beck, A. Bryman i Tim Futing Liao (red.), The SAGE Encyclopedia of Social Science Research Methods . (str. 107). Thousand Oaks, Kalifornia: Sage Publications, Inc. doi: 10.4135 / 9781412950589.n102
Odpowiedzi:
Po pierwsze, chciałbym powiedzieć, że oba wykresy dostarczają mi wyraźnych dowodów na istnienie efektu pułapu. Próbowałbym raczej zmierzyć ten efekt, a nie tylko wizualnie, obserwować, o ile nietrywialna część obserwacji leży w pobliżu górnej granicy zakresu instrumentu. Zazwyczaj efekt pułapu zawsze będzie istniał, o ile nie jest to trywialna część osób, które osiągają maksymalny wynik w teście.
Jednak powiedziawszy, technologia analizy testów znacznie się rozwinęła, ponieważ musieliśmy bezpośrednio interpretować wyniki na instrumencie w oparciu o prawidłowy wynik. Możemy teraz użyć Teorii Reakcji na Przedmiot, aby oszacować parametry poszczególnych przedmiotów i użyć tych przedmiotów do zidentyfikowania zdolności podmiotu. Oczywiście, jeśli test sprawi, że test będzie zbyt łatwy, nadal mogą wystąpić efekty sufitowe. Jednak ze względu na moc teorii odpowiedzi na przedmioty powinniśmy być w stanie umieścić w instrumencie co najmniej kilka przedmiotów o wystarczająco wysokim stopniu trudności, aby zapobiec uderzeniu pułapu tylko trywialnej części populacji.
Dzięki za pytanie. To jest bardzo interesujące!
źródło
Wydaje mi się, że szorstkim i gotowym sposobem byłoby zmierzenie wariancji wraz ze wzrostem skali. Jeśli pokazuje to zmniejszenie, oznacza to, że występuje efekt pułapu, a jeśli nie, nie ma efektu pułapu. Możesz stworzyć jednorodność wariancji. Test Levene'a może być przydatny do ustalenia, czy wariancja jest różna w różnych punktach skali.
źródło
Krytycznym problemem przy podejmowaniu decyzji, czy skupienie wokół najwyższego lub najniższego punktu jest spowodowane efektem sufitu / podłogi, jest to, czy wartości przypadków faktycznie „reprezentują” wartość. Kiedy występują efekty sufitu / podłogi, niektóre przypadki, pomimo przyjęcia wartości maksymalnej lub minimalnej, są w rzeczywistości wyższe / niższe od wartości maksymalnej lub minimalnej (wyobraź sobie, że dorosły i dziecko kończą niezwykle prosty test matematyczny, który miał zmierzyć własne zdolności matematyczne i oba uzyskały 100%). Tutaj dane są cenzurowane.
Inny scenariusz jest również możliwy, gdy używamy skal ograniczonych, takich jak skala podobna do Likerta, która ma nieodłączne górne i dolne granice. Jest całkiem możliwe, że ci, którzy osiągnęli najwyższy wynik, są rzeczywiście tego warti i nie ma różnic (takich jak powyższy przykład matematyczny) wśród wszystkich, którzy osiągnęli najwyższe wyniki. W takim przypadku dane są obcinane do granic, a nie cenzurowane.
Opierając się na powyższym rozumowaniu, uważam, że należy opracować procedurę, która będzie pasować do każdego zestawu danych z obcinaniem i cenzurą danych. Jeśli model cenzury najlepiej pasowałby do danych, myślę, że wówczas można dojść do wniosku, że występuje efekt sufitu / podłogi.
źródło