Prognozy w regresji Coxa

38

Robię wielowymiarową regresję Coxa, mam swoje znaczące zmienne niezależne i wartości beta. Model bardzo dobrze pasuje do moich danych.

Teraz chciałbym użyć mojego modelu i przewidzieć przetrwanie nowej obserwacji. Nie jestem pewien, jak to zrobić za pomocą modelu Coxa. W regresji liniowej lub logistycznej byłoby łatwo, po prostu wstawić wartości nowej obserwacji do regresji i pomnożyć je przez bety, więc mam prognozę mojego wyniku.

Jak mogę określić moje podstawowe zagrożenie? Potrzebuję go oprócz obliczania prognozy.

Jak to się robi w modelu Coxa?

Marja
źródło

Odpowiedzi:

30

Wykorzystaniu modelu Cox'a, oszacowane ryzyko dla indywidualnego z współzmienna wektora x i ma postać h ı ( t ) = H 0 ( t ) exp ( x " i β ) , w którym β znajduje maksymalizując częściowe prawdopodobieństwo , a H 0 wynika z estymatora Nelson, Aalen, H 0 ( t I ) = d Iixi

h^i(t)=h^0(t)exp(xiβ^),
β^h^0 zT1,T2,..., że różne czasy zdarzeń idiliczba zgonów wtI (patrz, na przykład,rozdział 3.6).
h^0(ti)=dij:tjtiexp(xjβ^)
t1t2,diti

S^i(t)=S^0(t)exp(xiβ^)
S^0(t)=exp(Λ^0(t))
Λ^0(t)=j:tjth^0(tj).

EDYCJA: To może być również interesujące :-)

ocram
źródło
1
To jest dokładnie moje pytanie ... Potrzebuję oszacowania wyjściowej funkcji hazardu, aby móc przewidzieć, prawda? Czy znasz metodę jej oszacowania?
Marja,
2
@Marjan, scyzoryk może nie odzwierciedlać niepewności spowodowanej wyborem zmiennych. Pasek startowy prawidłowo pokazuje większą zmienność, w której zmienne są oznaczone jako „znaczące”. Jeśli chcesz przeprowadzić „względną weryfikację”, możesz wykazać, że dyskryminacja predykcyjna jest dobra po skorygowaniu o nadmierne dopasowanie. Nie wymaga to radzenia sobie z podstawowym zagrożeniem, ale weryfikuje względne szacunki zagrożeń logarytmicznych. Zrobi to validatefunkcja w rmspakiecie R w połączeniu z cphfunkcją. Jedynym algorytmem validatekrokowym zaimplementowanym jest krokowe cofanie.
Frank Harrell,
1
Uzyskanie przewidywanych względnych zagrożeń (tj. Liniowego predyktora) jest dość proste. Ale zrezygnowałem z SAS w 1991 roku.
Frank Harrell,
8
Link nie działa :-(.
gung - Przywróć Monikę
2
Czy istnieje sposób przewidzenia czasu przeżycia T dla konkretnej osoby? Mam na myśli, że biorąc pod uwagę listę wartości dla zmiennych towarzyszących, w jaki sposób można ustalić czas, po którym jednostka najprawdopodobniej umrze?
statBeginner
14

Funkcja predictSurvProbw pecpakiecie może dać ci bezwzględne oszacowania ryzyka dla nowych danych w oparciu o istniejący model Coxa, jeśli używasz R.

Matematyczne szczegóły, których nie potrafię wyjaśnić.

EDYCJA: Funkcja zapewnia prawdopodobieństwo przeżycia, które do tej pory uważałem za 1- (prawdopodobieństwo zdarzenia).

EDYCJA 2:

Można obejść się bez pakietu pec. Używając tylko pakietu przetrwania, następująca funkcja zwraca bezwzględne ryzyko na podstawie modelu Coxa

risk = function(model, newdata, time) {
  as.numeric(1-summary(survfit(model, newdata = newdata, se.fit = F, conf.int = F), times = time)$surv)
}
miura
źródło
Prawdopodobieństwo przeżycia 1 to ryzyko skumulowane. Myślę, że OP żąda natychmiastowej funkcji hazardu (linii bazowej) lub pewnego rodzaju wygładzonej oceny ( muhazpakiety w R).
ECII
1
Prawdopodobieństwo przeżycia 1 nie jest skumulowanym zagrożeniem. W przypadku braku konkurujących zagrożeń oba są połączone zgodnie ze szczegółami na en.wikipedia.org/wiki/… .
miura
Prawdopodobieństwo przeżycia 1 = wskaźnik awaryjności (przy założeniu, że tylko 1x metoda awarii). Zależność prawdopodobieństwa przeżycia od skumulowanego zagrożenia jest przedstawiona w przyjętej odpowiedzi: S(t)=exp(−Λ(t))gdzie Λ(t)jest skumulowane zagrożenie.
NickBraunagel
11

Może chciałbyś też spróbować czegoś takiego? Dopasuj proporcjonalny model zagrożeń Coxa i użyj go, aby uzyskać przewidywaną krzywą przeżycia dla nowej instancji.

Wyjęto z pliku pomocy dla pliku survfit.coxph w R (właśnie dodałem część wierszy)

# fit a Cox proportional hazards model and plot the  
# predicted survival for a 60 year old 
fit <- coxph(Surv(futime, fustat) ~ age, data=ovarian) 
plot(survfit(fit, newdata=data.frame(age=60)),
     xscale=365.25, xlab="Years", ylab="Survival", conf.int=F) 
# also plot the predicted survival for a 70 year old
lines(survfit(fit, newdata=data.frame(age=70)),
     xscale=365.25, xlab="Years", ylab="Survival") 

Należy jednak pamiętać, że aby założyć, że przewidywanie proporcjonalnych zagrożeń będzie nadal obowiązywało w przewidywaniu, pacjent, dla którego przewiduje się, powinien pochodzić z grupy, która jest jakościowo taka sama jak ta, której użyto do wyprowadzenia modelu proporcjonalnych zagrożeń, którego użyto dla Prognoza.

Slak
źródło
6

basehazFunkcją survivalopakowań stanowi zagrożenie bazowego w punktach czasowych wydarzenie. Na tej podstawie możesz rozwinąć matematykę zapewnianą przez ocram i uwzględnić OR swoich szacunków Coxpha.

ECII
źródło
2

Istotą modelu Coxa jest założenie o proporcjonalnym zagrożeniu i wykorzystanie częściowego prawdopodobieństwa. Częściowe prawdopodobieństwo wyeliminowało podstawową funkcję hazardu. Więc nie musisz go określać. To jest jego piękno!

Michael Chernick
źródło
2
Jeśli jednak chcesz uzyskać oszacowanie zagrożenia lub przeżycia dla określonej wartości wektora zmiennej towarzyszącej, musisz oszacować podstawowe zagrożenie lub przeżycie. Szacunki Nelsona-
Aalena
1
Często w modelu Coxa porównuje się dwie funkcje przeżycia, a kluczem jest współczynnik ryzyka, a nie funkcja hazardu. Zagrożenie podstawowe jest jak uciążliwy parametr, który Cox tak sprytnie wyeliminował z problemu, stosując założenie o proporcjonalnych zagrożeniach. Jakakolwiek metoda, której chcesz użyć do oszacowania funkcji hazardu i / lub hazardu bazowego w kontekście modelu, wymagałaby zastosowania formy Coxa modelu, która wymusza proporcjonalność.
Michael Chernick,
Dziękuję bardzo, Byłoby wspaniale, gdybyś zobaczył mój komentarz do odpowiedzi ocram. Może ty też mógłbyś mi pomóc?
Marja
3
Możesz także rozwarstwiać czynniki, które nie stanowią proporcjonalnego ryzyka. W każdym razie model Coxa i jego oszacowanie po ryzyku odniesienia mogą być wykorzystane do uzyskania przewidywanych kwantyli czasu przeżycia, różnych prawdopodobieństw przeżycia i przewidywanego średniego czasu przeżycia, jeśli masz długoterminowe obserwacje. Wszystkie te ilości są łatwe do uzyskania w pakiecie R rms.
Frank Harrell,
Nie musisz go określać, ale jest szacowane.
DWin