Jak radzić sobie z efektem sufitu dzięki narzędziu pomiarowemu?

12

Zebrałem dane psychofizjologiczne mierzące zdolność badanych (dwóch grup) do postrzegania wibracji. Wibrująca sonda porusza się po skórze przy coraz mniejszych przemieszczeniach, a pacjent wskazuje, kiedy odczuwa wibrację. Niestety, przy wysokich częstotliwościach sonda może poruszać się tylko na niewielką odległość, a czasami największa odległość, na którą sonda może się poruszać, wciąż nie jest wystarczająco duża, aby podmioty mogły ją dostrzec. Tak więc mam dokładne wartości progowe dla niektórych pacjentów, ale dla tych, którzy nigdy nie odczuwali wibracji, po prostu mam wartość, o której wiem, że ich próg jest większy niż. Czy jest jakiś sposób, aby nadal uwzględnić te dane? A jaki jest najlepszy sposób na jego analizę?

Cale
źródło
5
Są to tak zwane obserwacje cenzurowane . Sposób włączenia zależy od rodzaju przeprowadzanej analizy statystycznej.
Zgadzam się z Procrastinatorem, z tym wyjątkiem, że użyłbym terminu obciętego. Podejście do prostego problemu zwanego prawą cenzurą występuje w analizie przeżycia, w której zachowuje się skróconą wartość, ale ma zmienną wskaźnikową, która informuje, czy wartość jest wartością całkowitą, czy cenzurowaną. W analizie przeżycia istnieje prosty sposób, aby sobie z tym poradzić, ale dzieje się tak, ponieważ szacujesz krzywą przeżycia. Tutaj możesz chcieć obliczyć średnie. Jeśli zignorujesz trucację, nie doceniasz średniej. Jeśli wyrzucisz obcięte punkty, nie doceniasz średniej.
Michael R. Chernick
Aby poprawnie uwzględnić obcięte wartości, trzeba mieć model prawdopodobieństwa dla odległości sondy, biorąc pod uwagę, że jest ona większa niż próg. Następnie można przyjąć średnią tego rozkładu i obliczyć średnią ważoną przy użyciu średniej dla wartości, które nie zostały obcięte ze średnią dla rozkładu obciętego, gdzie ważenie jest zgodne z odsetkiem przypadków obciętych.
Michael R. Chernick
4
Obcinanie jest tym, co by się stało, gdybyś wyrzucił niekwantowane dane. Nie chcesz tego robić! Masz rację, Cale, że w tych cenzurowanych wartościach są informacje i podejrzewasz, że istnieją pewne standardowe sposoby ich analizy (i pułapki dla nieostrożnych). Ale aby udzielić dobrej odpowiedzi, musielibyśmy wiedzieć, jakiego rodzaju analizy szukasz. W szczególności sposób traktowania tych danych jest zasadniczo różny w zależności od tego, czy występują w regresji jako zmienne zależne czy niezależne. Może mógłbyś to rozwinąć?
whuber
1
Mały szczegół niezwiązany z danym pytaniem statystycznym, ale warto wiedzieć: dane tego rodzaju są zwykle nazywane danymi „psychofizycznymi”, a nie „psychofizjologicznymi” (które obejmują takie rzeczy, jak tętno lub pomiary przewodności skóry, ale nie subiektywne oceny odczuć ). Może to również pomóc w szukaniu literatury na temat tego, jak ludzie zazwyczaj traktują tego rodzaju dane.
Gala

Odpowiedzi:

2

Lubię używać heterogenicznych modeli mieszanin do opisywania połączonych efektów z zasadniczo różnych źródeł.

Możesz spojrzeć na coś w rodzaju modelu „Zero Inflated Poisson” w stylu Diane Lambert. „ Zero napompowana regresja Poissona z zastosowaniem do wad produkcyjnych ”, Diane Lambert, Technometrics, tom. 34, Iss. 1, 1992

Uważam ten pomysł za szczególnie zachwycający, ponieważ wydaje się on zaprzeczać poglądowi, że zastosowanie statystycznego projektu eksperymentów w medycynie nie może w pełni wyleczyć choroby. Stoi za tym pogląd, że metoda naukowa nie może zrealizować swojego celu w medycynie, wynika z faktu, że nie ma danych o chorobach od „doskonale” zdrowej osoby i dlatego dane nie mogą pomóc w zaradzeniu chorobie. Bez pomiaru nie ma miejsca na poprawę.

Użycie czegoś w rodzaju modelu z zerowym napełnieniem pozwala wydobyć przydatne informacje z danych, które są częściowo „wolne od błędów”. Wykorzystuje wgląd w proces, aby wziąć informacje, które można by uznać za „milczące” i zmusić je do wypowiedzenia się. Dla mnie jest to coś, co próbujesz zrobić.

Teraz nie mogę zacząć twierdzić, jakich kombinacji modeli użyć. Podejrzewam, że możesz użyć zerowego napełnionego modelu mieszanki Gaussa (GMM) na początek. GMM jest trochę empirycznym uniwersalnym aproksymatorem ciągłych plików PDF - podobnie jak kuzyn PDF z aproksymacji serii Fouriera, ale ze wsparciem centralnego twierdzenia granicznego w celu poprawy globalnego zastosowania i dopuszczenia zwykle o wiele mniejszej liczby komponentów w celu uzyskania „ dobre ”zbliżenie.

Powodzenia.

EDYTOWAĆ:

Więcej na temat modeli z zerowym napełnieniem:

EngrStudent
źródło
0

Grupowanie wyników i definiowanie skali może być rozwiązaniem.

Utwórz zmienną kategorii w taki sposób (lub inaczej):

  1. Wysoka czułość
  2. Normalna czułość
  3. Niska czułość
  4. Niewrażliwy (te, które w twoim przypadku są poza skalą)

Możesz użyć tej zmiennej do wykonania analizy, ale to, czy wyniki są znaczące, zależy od tego, jak dobrze zdefiniujesz kategorie.

Dennis Jaheruddin
źródło