Pomiar niektórych pacjentów więcej niż jeden raz

10

Prowadzę badanie kliniczne, w którym określam antropometryczną miarę pacjentów. Wiem, jak sobie poradzić z sytuacją, w której mam jednego pomiaru na pacjenta: tworzę model, w którym mam losową próbkęX1,,Xn z pewnej gęstości fθ, i robię zwykłe rzeczy: piszę prawdopodobieństwo próbki, oszacuj parametry, określaj zestawy ufności i testuj hipotezę, a nawet wykonuj niektóre analizy bayesowskie, jeśli szef nie patrzy. ;-)

Mój problem polega na tym, że dla niektórych pacjentów mamy więcej niż jedną miarę, ponieważ uważamy, że dobrym pomysłem jest posiadanie więcej niż jednego naukowca obsługującego urządzenie pomiarowe, gdy jest to możliwe (czasami mamy tylko jednego naukowca pracującego w klinice ). Dlatego dla niektórych pacjentów mamy jedną miarę wykonaną przez jednego badacza, dla innych jednostek próbki mamy dwie miary wykonane przez dwóch różnych badaczy i tak dalej. Miarą jest grubość określonego fałdu skórnego.

Moje pytanie: jaki model statystyczny jest odpowiedni dla mojego problemu?

Wroński
źródło
4
O ile interesujące pytania nie odnoszą się do konkretnych badaczy, a ty masz informacje, by powiedzieć, kto dokonał jakich pomiarów, możesz patrzeć na modele mieszane z losowym efektem „badacza” (co może tłumaczyć rzeczy takie jak badacz mający małą, ale na przykład spójne uprzedzenia).
Glen_b Przywróć Monikę
1
Czy masz informacje, który naukowiec dokonał pomiaru? Czy uważasz, że niektóre badania popełniają błędy systematyczne? Czy niektórzy badacze mierzą bardziej precyzyjnie niż inni?
user31264
1
Czy w praktyce rzeczywiście występują duże różnice między badaczami mierzącymi tego samego pacjenta w tym samym czasie?
EdM
Podobnie jak @Glen_b Myślę, że powinieneś spojrzeć na modele efektów mieszanych, może to może być początek: stats.stackexchange.com/questions/166434/…

Odpowiedzi:

1

Przeczytaj artykuł Brennana (1992) na temat teorii uogólnienia lub jego książkę, zatytułowaną „Teoria uogólnienia” (2010, Springer). Brennan pisze o GT za pomocą ANOVA, ale modele mieszane mogą być używane w ten sam sposób - i wielu uważa je za nowszą metodę.

Można pomyśleć o modelu mieszanym dla danych krzyżowych (np. Raudenbush, 1993 ). Powiedz, że maszN. pacjentów mierzonych według R badacze, a wasz pomiar jest oznaczony jako Xjajot dla ja=1,...,N. i jot=1,...,R. W tym przypadku pomiar ma zarówno wpływ na pacjentów, jak i badaczy, przy czym pacjenci „zagnieżdżają się” u badaczy (wiele pomiarów dla jednego pacjenta), a badacze „zagnieżdżają” się u pacjentów (wiele pomiarów dla każdego pacjenta), więc

Xjajot=β0+bja+bjot+εjajot

gdzie β0 jest stałym punktem przecięcia (jeśli dane nie są wyśrodkowane), bja jest przypadkowym efektem pacjenta (losowe przechwytywanie) i bjot to losowy efekt badacza, natomiast εjajotjest terminem błędu. W lme4 byłoby to

x ~ (1|patient) + (1|researcher)

możesz rozszerzyć to podejście na używanie X jako niezależną zmienną lub zdefiniować hierarchiczny model bayesowski, w którym uwzględniono oba źródła zmienności.

Tim
źródło
0

Zaryzykuję to, mimo że mogę jedynie przedstawić model matematyczny, ponieważ jestem trochę kujonem matematyki, ale nie statystykiem.

Filtry Kalmana mogą obsługiwać oszacowanie stanu z wieloma wejściami i brakującymi informacjami.

Gdybym musiał to pokazać inżynierom, wymagałoby to ode mnie sporządzenia wykresów zmienności między technikami pomiarowymi, aby wykazać, że nie ma zmienności między operatorami. Traktowali dwa pomiary jako sparowane. Statystyki ludzie są w tym dobrzy. Gdyby zmienność między operatorami była znikoma, wówczas mogłem sformułować swoje dane z każdą z nich jako pojedynczą linię.

  • [... pomiar_1 ... wynik]
  • [... pomiar_2 ... wynik]

gdyby tylko jeden technik dokonał pomiaru, byłaby tylko jedna linia danych

w przeciwnym razie chciałbym mieć wskazanie operatora w danych

  • [... pomiar nazwy operatora ... wynik]

Jeśli potrafisz scharakteryzować różnicę, jaką każdy operator ma na tym samym pomiarze, możesz to uwzględnić w swoim modelu. Jeśli nie podasz wskaźnika operatora, gdy jest to znaczące źródło zmienności ... może to stanowić problem.

Model danych informuje model matematyczny. Myślę, że GLM osiągnęły dobre wyniki w tych obszarach. http://www.uta.edu/faculty/sawasthi/Statistics/stglm.html

EngrStudent
źródło
0

Przychodzę również na to pytanie z innej dziedziny. Niezależnie od tego, wydaje mi się, że celem korzystania z urządzenia pomiarowego przez wiele osób jest uwzględnienie błędu pomiaru? Jeśli mam rację, rozumiem, co próbujesz zrobić, brzmi to jak przypadek modelowania równań strukturalnych (SEM), który pozwoliłby ci uruchomić model bez błędów pomiaru. SEM może uwzględniać brakujące dane, jeśli używasz technik szacowania FIML, musisz przyjąć zwykłe założenia dotyczące brakujących danych (tj. Co najmniej losowo). Modele SEM były coraz częściej używane w ustawieniach RCT, więc nie sądzę, aby stosowanie tej techniki było rzadkością. Pytanie, które mam, brzmi: czy masz wystarczająco dużo informacji, aby stworzyć właściwie identyfikowalny model SEM?

bfoste01
źródło