Pokazuje, że 100 pomiarów dla 5 pacjentów dostarcza znacznie mniej informacji niż 5 pomiarów dla 100 pacjentów

21

Na konferencji usłyszałem następujące oświadczenie:

100 pomiarów dla 5 osób dostarcza znacznie mniej informacji niż 5 pomiarów dla 100 osób.

To trochę oczywiste, że to prawda, ale zastanawiałem się, jak można to udowodnić matematycznie ... Myślę, że można zastosować liniowy model mieszany. Jednak niewiele wiem o matematyce użytej do ich oszacowania (po prostu biegam lmer4po LMM i bmrsGLMM :) Czy możesz mi pokazać przykład, w którym to jest prawda? Wolałbym odpowiedź z pewnymi formułami, a nie z pewnym kodem w R. Zapraszam do przyjęcia prostego ustawienia, takiego jak na przykład liniowy model mieszany z normalnie rozmieszczonymi losowymi punktami przecięcia i nachyleniami.

PS, odpowiedź matematyczna, która nie obejmuje LMM, również byłaby w porządku. Myślałem o LMM, ponieważ wydawały mi się naturalnym narzędziem wyjaśniającym, dlaczego mniej miar z większej liczby przedmiotów jest lepszych niż więcej miar z kilku przedmiotów, ale mogę się mylić.

DeltaIV
źródło
3
+1. Wydaje mi się, że najprostszym ustawieniem byłoby rozważenie zadania polegającego na oszacowaniu średniej populacji której każdy badany ma swoją średnią a każdy pomiar tego przedmiotu jest dystrybuowany jako . Jeśli weźmiemy pomiarów z każdej przedmiotów, a co za optymalny sposób zestaw i dany stały produkt . a N ( μ , σ 2 a ) x N ( a , σ 2 ) n m n m n m = NμaN(μ,σa2)xN(a,σ2)nmnmnm=N
ameba mówi Przywróć Monikę
„Optymalny” w sensie minimalizacji wariancji średniej próbki pozyskanych punktów danych. N
ameba mówi Przywróć Monikę
1
Tak. Ale w przypadku twojego pytania nie musimy dbać o to, jak oszacować wariancje; twoje pytanie (tj. cytat w twoim pytaniu) dotyczy tylko oszacowania globalnej średniej i wydaje się oczywiste, że najlepszy estymator podaje wielka średnia wszystkich punktów w próbce. Pytanie brzmi zatem: biorąc pod uwagę , , , oraz , jaka jest wariancja ? Jeśli wiadomo, że będzie w stanie zminimalizować względem danej w ograniczenia. ˉ x N = n m μ σ 2 σ 2 a n m ˉ x n n m = Nμx¯N=nmμσ2σa2nmx¯nnm=N
ameba mówi Przywróć Monikę
1
Nie wiem, jak to wywnioskować, ale zgadzam się, że wydaje się to oczywiste: aby oszacować wariancję błędu, najlepiej byłoby mieć wszystkie pomiary od jednego pacjenta; i aby oszacować wariancję osobnika (prawdopodobnie?) najlepiej byłoby mieć N różnych osobników z 1 pomiarem każdy. Nie jest to jednak tak jasne co do średniej, ale moja intuicja podpowiada mi, że najlepiej byłoby mieć N badanych z 1 pomiarem. Zastanawiam się, czy to prawda ...NNN
ameba mówi Przywróć Monikę
2
Może coś takiego: wariancja średnich próbek na podmiot powinna wynosić , gdzie pierwszy składnik to wariancja podmiotu, a drugi to wariancja oceny średniej każdego podmiotu. Wówczas wariancja średniej dla badanych (tj. Średnia) będzie wynosić ( σ 2 a + σ 2 / n ) / m = σ 2 a / m + σ 2 / ( n m ) = σ 2 a / mσa2+σ2/n który jest zminimalizowany, gdy m = N .
(σa2+σ2/n)/m=σa2/m+σ2/(nm)=σa2/m+σ2/N=σa2/m+const,
m=N
ameba mówi Przywróć Monikę

Odpowiedzi:

25

Krótka odpowiedź brzmi: twoja hipoteza jest prawdziwa wtedy i tylko wtedy, gdy istnieje pozytywna korelacja wewnątrz klasy w danych . Empirycznie, większość zestawów danych w klastrach przez większość czasu wykazuje dodatnią korelację wewnątrz klasy, co oznacza, że ​​w praktyce twoje przypuszczenia są zwykle prawdziwe. Ale jeśli korelacja wewnątrz klasy wynosi 0, to dwa wspomniane przypadki są równie pouczające. A jeśli korelacja wewnątrz klasy jest ujemna , to w rzeczywistości mniej pouczające jest dokonywanie mniejszej liczby pomiarów na większej liczbie tematów; wolelibyśmy (jeśli chodzi o zmniejszenie wariancji oszacowania parametru) wykonać wszystkie nasze pomiary na jednym obiekcie.

Statystycznie są dwie perspektywy, z której możemy myśleć o tym: a random-effects (lub mieszany ) modelu , który wspomina w swoim pytaniu, czy marginalny modelu , który kończy się nieco bardziej pouczające tutaj.

Model efektów losowych (mieszanych)

Powiedzmy, że mamy zestaw obiektów, od których każdy wykonaliśmy m pomiarów. Wtedy prostym modelem efektów losowych j- tego pomiaru od i- tego obiektu może być y i j = β + u i + e i j , gdzie β jest stałym punktem przecięcia, u i jest losowym efektem podmiotu (z wariancją σ 2 u ), e i j jest składnikiem błędu poziomu obserwacji (z wariancją σ 2 enmji

yij=β+ui+eij,
βuiσu2eijσe2), a dwa ostatnie losowe terminy są niezależne.

W tym modelu reprezentuje średnią populacji, a przy zbilansowanym zbiorze danych (tj. Takiej samej liczbie pomiarów od każdego pacjenta) naszym najlepszym oszacowaniem jest po prostu średnia próbki. Więc jeśli weźmiemy „więcej informacji” za mniejszą wariancję dla tego oszacowania, to zasadniczo chcemy wiedzieć, w jaki sposób wariancja średniej próbki zależy od n i m . Przy odrobinie algebry możemy wypracować tę zmienną ( 1βnm Analizując to wyrażenie, możemy zauważyć, żeilekroć istnieje dowolność wariancji podmiotu(tj.Σ2u>0), zwiększenie liczby podmiotów (n) spowoduje zmniejszenie obu tych terminów, przy jednoczesnym zwiększeniu liczby pomiarów na podmiot (m) zmniejszy jedynie drugi termin. (Aby poznać praktyczną implikację tego przy projektowaniu projektów replikacji dla wielu witryn, zobaczten post na blogu, który napisałem jakiś czas temu).

var(1nmjajotyjajot)=var(1nmjajotβ+uja+mijajot)=1n2)m2)var(jajotuja+jajotmijajot)=1n2)m2)(m2)javar(uja)+jajotvar(mijajot))=1n2)m2)(nm2)σu2)+nmσmi2))=σu2)n+σmi2)nm.
σu2)>0nm

Teraz chciałeś wiedzieć, co się dzieje, gdy zwiększamy lub zmniejszamy lub n , utrzymując stałą całkowitą liczbę obserwacji. Więc za to uważamy n m być stała, tak że całe wyrażenie wariancji właśnie wygląda σ 2 umnnm która jest tak mała, jak to możliwe, gdynjest tak duże, jak to możliwe (maksymalnie don=nm, w którym to przypadkum=1, co oznacza, że ​​bierzemy pojedynczy pomiar od każdego obiektu).

σu2)n+stały,
nn=nmm=1

ρ=σu2)σu2)+σmi2)
var(1nmjajotyjajot)=σu2)n+σmi2)nm=(ρn+1-ρnm)(σu2)+σmi2))

σu2)ρ

Model brzeżny

yjajot

yjajot=β+mijajot,
ujamijajotmijajot=uja+mijajotujamijajotmijajotdo
do=σ2)[R000R000R],R=[1ρρρ1ρρρ1]
ρmiρρ.)

var(1nmjajotyjajot)=var(1nmjajotβ+mijajot)=1n2)m2)var(jajotmijajot)=1n2)m2)(n(mσ2)+(m2)-m)ρσ2)))=σ2)(1+(m-1)ρ)nm=(ρn+1-ρnm)σ2),
σmi2)+σu2)=σ2)mijajot=uja+mijajot

ρ-1/(m-1)m=2)ρ=-1m=3)ρ=-1/2)

nm

(1+(m-1)ρ)×dodatnia stała.
ρ>0mρ<0mnmρ=0mn
Jake Westfall
źródło
3
ρ<0nmσuβ
3
mρ
1
σu2)Σ
2
σu2)+σmi2)/mja
1
mρm