Mam model przeżycia z pacjentami zagnieżdżonymi w szpitalach, który zawiera losowy efekt dla szpitali. Efekt losowy rozkłada się w zależności od promieniowania gamma i staram się opisać „trafność” tego terminu w skali, która jest łatwa do zrozumienia.
Znalazłem następujące odniesienia, które wykorzystują Medianę Hazard Ratio (trochę jak Median Ratio), i obliczyłem to.
Bengtsson T, Dribe M: Historical Methods 43:15, 2010
Jednak teraz chcę zgłosić niepewność związaną z tymi szacunkami za pomocą bootstrap. Dane są danymi o przeżyciu, a zatem istnieje wiele obserwacji na pacjenta i wielu pacjentów na szpital. Wydaje się oczywiste, że muszę ponownie skupić obserwacje pacjenta podczas ponownego próbkowania. Ale nie wiem, czy powinienem także skupić szpitale (tj. Przeskalować szpitale, a nie pacjentów?
Zastanawiam się, czy odpowiedź zależy od parametru zainteresowania, a więc byłby inny, gdyby cel był istotny na poziomie pacjenta, a nie szpitala?
Poniżej wymieniłem kod stata na wypadek, gdyby to pomogło.
cap program drop est_mhr
program define est_mhr, rclass
stcox patient_var1 patient_var2 ///
, shared(hospital) ///
noshow
local twoinvtheta2 = 2 / (e(theta)^2)
local mhr = exp(sqrt(2*e(theta))*invF(`twoinvtheta2',`twoinvtheta2',0.75))
return scalar mhr = `mhr'
end
bootstrap r(mhr), reps(50) cluster(hospital): est_mhr
źródło
Odpowiedź wydaje się, że proces ponownego próbkowania musi uwzględniać strukturę danych. Jest tutaj dobre wyjaśnienie (wraz z pewnym kodem R, aby to zaimplementować).
http://biostat.mc.vanderbilt.edu/wiki/Main/HowToBootstrapCorrelatedData
Dzięki wskaźnikowi z UCLA Statistics Consulting Group .
Napisałem szybszą (ale mniej elastyczną) wersję fragmentu kodu powiązanego z powyższym - sprawdź tutaj, aby uzyskać aktualizacje i szczegóły.
źródło