Prowadzę badanie kliniczne, w którym określam antropometryczną miarę pacjentów. Wiem, jak sobie poradzić z sytuacją, w której mam jednego pomiaru na pacjenta: tworzę model, w którym mam losową próbkę z pewnej gęstości , i robię zwykłe rzeczy: piszę prawdopodobieństwo próbki, oszacuj parametry, określaj zestawy ufności i testuj hipotezę, a nawet wykonuj niektóre analizy bayesowskie, jeśli szef nie patrzy. ;-)
Mój problem polega na tym, że dla niektórych pacjentów mamy więcej niż jedną miarę, ponieważ uważamy, że dobrym pomysłem jest posiadanie więcej niż jednego naukowca obsługującego urządzenie pomiarowe, gdy jest to możliwe (czasami mamy tylko jednego naukowca pracującego w klinice ). Dlatego dla niektórych pacjentów mamy jedną miarę wykonaną przez jednego badacza, dla innych jednostek próbki mamy dwie miary wykonane przez dwóch różnych badaczy i tak dalej. Miarą jest grubość określonego fałdu skórnego.
Moje pytanie: jaki model statystyczny jest odpowiedni dla mojego problemu?
Odpowiedzi:
Przeczytaj artykuł Brennana (1992) na temat teorii uogólnienia lub jego książkę, zatytułowaną „Teoria uogólnienia” (2010, Springer). Brennan pisze o GT za pomocą ANOVA, ale modele mieszane mogą być używane w ten sam sposób - i wielu uważa je za nowszą metodę.
Można pomyśleć o modelu mieszanym dla danych krzyżowych (np. Raudenbush, 1993 ). Powiedz, że maszN. pacjentów mierzonych według R badacze, a wasz pomiar jest oznaczony jako XI j dla ja = 1 , . . . , N i j = 1 , . . ., R . W tym przypadku pomiar ma zarówno wpływ na pacjentów, jak i badaczy, przy czym pacjenci „zagnieżdżają się” u badaczy (wiele pomiarów dla jednego pacjenta), a badacze „zagnieżdżają” się u pacjentów (wiele pomiarów dla każdego pacjenta), więc
gdzieβ0 jest stałym punktem przecięcia (jeśli dane nie są wyśrodkowane), bja jest przypadkowym efektem pacjenta (losowe przechwytywanie) i bjot to losowy efekt badacza, natomiast εI j jest terminem błędu. W lme4 byłoby to
x ~ (1|patient) + (1|researcher)
możesz rozszerzyć to podejście na używanieX jako niezależną zmienną lub zdefiniować hierarchiczny model bayesowski, w którym uwzględniono oba źródła zmienności.
źródło
Zaryzykuję to, mimo że mogę jedynie przedstawić model matematyczny, ponieważ jestem trochę kujonem matematyki, ale nie statystykiem.
Filtry Kalmana mogą obsługiwać oszacowanie stanu z wieloma wejściami i brakującymi informacjami.
Gdybym musiał to pokazać inżynierom, wymagałoby to ode mnie sporządzenia wykresów zmienności między technikami pomiarowymi, aby wykazać, że nie ma zmienności między operatorami. Traktowali dwa pomiary jako sparowane. Statystyki ludzie są w tym dobrzy. Gdyby zmienność między operatorami była znikoma, wówczas mogłem sformułować swoje dane z każdą z nich jako pojedynczą linię.
gdyby tylko jeden technik dokonał pomiaru, byłaby tylko jedna linia danych
w przeciwnym razie chciałbym mieć wskazanie operatora w danych
Jeśli potrafisz scharakteryzować różnicę, jaką każdy operator ma na tym samym pomiarze, możesz to uwzględnić w swoim modelu. Jeśli nie podasz wskaźnika operatora, gdy jest to znaczące źródło zmienności ... może to stanowić problem.
Model danych informuje model matematyczny. Myślę, że GLM osiągnęły dobre wyniki w tych obszarach. http://www.uta.edu/faculty/sawasthi/Statistics/stglm.html
źródło
Przychodzę również na to pytanie z innej dziedziny. Niezależnie od tego, wydaje mi się, że celem korzystania z urządzenia pomiarowego przez wiele osób jest uwzględnienie błędu pomiaru? Jeśli mam rację, rozumiem, co próbujesz zrobić, brzmi to jak przypadek modelowania równań strukturalnych (SEM), który pozwoliłby ci uruchomić model bez błędów pomiaru. SEM może uwzględniać brakujące dane, jeśli używasz technik szacowania FIML, musisz przyjąć zwykłe założenia dotyczące brakujących danych (tj. Co najmniej losowo). Modele SEM były coraz częściej używane w ustawieniach RCT, więc nie sądzę, aby stosowanie tej techniki było rzadkością. Pytanie, które mam, brzmi: czy masz wystarczająco dużo informacji, aby stworzyć właściwie identyfikowalny model SEM?
źródło