Jak interpretować krzywą przeżycia modelu zagrożenia Coxa?

9

Jak interpretujesz krzywą przeżycia z proporcjonalnego modelu hazardu Coxa?

W tym przykładzie zabawki załóżmy, że mamy proporcjonalny model hazardu Coxa dla agezmiennej w kidneydanych i generujemy krzywą przeżycia.

library(survival)
fit <- coxph(Surv(time, status)~age, data=kidney)
plot(conf.int="none", survfit(fit))
grid()

wprowadź opis zdjęcia tutaj

Na przykład o czasie 200, które stwierdzenie jest prawdziwe? czy oba są w błędzie?

  • Oświadczenie 1: pozostanie nam 20% przedmiotów (np. Jeśli mamy) 1000 ludzie, za dnia 200powinniśmy mieć około 200 lewo),

  • Oświadczenie 2: Dla jednej osoby ma on / ona 20% szansa na przeżycie w dzień 200.


Moja próba: nie sądzę, aby te dwa stwierdzenia były takie same (poprawcie mnie, jeśli się mylę), ponieważ nie mamy założenia iid (czas przeżycia dla wszystkich ludzi NIE czerpie z jednej dystrybucji niezależnie). Jest ona podobna do regresji logistycznej w moje pytanie tutaj , wskaźnik szkodliwości dla każdej osoby zależy odβTx dla tej osoby.

Haitao Du
źródło
Pamiętaj, że Twój model zakłada niezależność między czasami zdarzeń.
ocram
analiza przeżycia może mieć założenia niezależności
Aksakal
więc wydaje się, że pytanie dotyczy raczej kodowania R niż czystych statystyk. trzeba znać składnię i cechy poszczególnych funkcji użytych w przykładzie. jeśli tak jest, czy nie jest to w jakiś sposób nie na temat? w przeciwnym razie musisz wyjaśnić, co dzieje się z tymi, którzy nie używają R
Aksakal

Odpowiedzi:

5

Ponieważ zagrożenie zależy od zmiennych towarzyszących, podobnie funkcja przetrwania. Model zakłada, że ​​funkcja hazardu osoby z wektorem zmiennym towarzyszącymx jest

h(t;x)=h0(t)eβx.
W związku z tym skumulowane zagrożenie tej osoby wynosi
H(t;x)=0th(u;x)du=0th0(u)eβxdu=H0(t)eβx,
gdzie możemy zdefiniować H0(t)=0th0(u)dujako podstawowe skumulowane zagrożenie. Funkcja przeżycia dla osoby z wektorem zmiennym towarzyszącymx jest z kolei
S(t;x)=eH(t;x)=eH0eβx=S0(t)eβx
gdzie zdefiniujemy S0(t)=eH0(t) jako podstawowa funkcja przeżycia.

Podane szacunki β^ i S^0(t) współczynników regresji i wyjściowej funkcji przeżycia, oszacuj funkcję przeżycia dla osoby z wektorem współzmiennym x jest dany przez S^(t;x)=S^0(t)eβ^x.

Oblicz to w R, określ wartość zmiennych towarzyszących w newdataargumencie. Na przykład, jeśli chcesz funkcji przeżycia dla osób w wieku = 70, w R, zrób

plot(survfit(fit, newdata=data.frame(age=70)))

Jeśli, tak jak ty, pominiesz newdataargument, jego wartość domyślna będzie równa średnim wartościom zmiennych towarzyszących w próbce (patrz ?survfit.coxph). To, co pokazano na wykresie, jest szacunkoweS0(t)eβx¯.

Jarle Tufto
źródło
Zgadzam się z Tobą. To ładnie napisana odpowiedź. Przepraszam OP za mój błąd i doceniam sposób, w jaki OP go poprawił.
Michael R. Chernick
@ hxd1101 Po dokładniejszym przeczytaniu strony pomocy survfit.coxphpoprawiłem błąd w mojej odpowiedzi, patrz aktualizacja.
Jarle Tufto
2

Pozostanie nam 20% przedmiotów (np. Jeśli mamy 1000 osób, do 200 dnia powinniśmy mieć 200 osób)? lub Dla danej osoby ma 20% szans na przeżycie w dniu 200?

W najczystszej postaci krzywa Kaplana-Meiera w twoim przykładzie nie zawiera żadnej z powyższych instrukcji.

Pierwsze oświadczenie sprawia, że przyszłościowy projekcja będzie miała . Podstawowa krzywa przetrwania opisuje tylko przeszłość, twoją próbkę. Tak, 20% twojej próbki przeżyło do 200 dnia. Czy 20% przetrwa w ciągu następnych 200 dni? Niekoniecznie.

Aby stworzyć to stwierdzenie, musisz dodać więcej założeń, zbudować model itp. Model nie musi nawet być statystyczny w sensie podobnym do regresji logistycznej. Na przykład może to być PDE w epidemiologii itp.

Twoje drugie stwierdzenie opiera się prawdopodobnie na pewnym założeniu jednorodności: wszyscy ludzie są tacy sami.

Aksakal
źródło
Nie sądzę, aby stwierdzenie 2 było słuszne, ponieważ każda osoba ma inne zdanie x i βTxprzyczynia się do zagrożenia. jak możemy założyć, że wszyscy ludzie są tacy sami?
Haitao Du
@ hxd1011, to zależy od twojego modelu. Jeśli modelowałeś części samochodowe, możesz założyć, że są takie same. z drugiej strony ich niepowodzenia mogą być skorelowane z numerem partii, wtedy nie są takie same itp.
Aksakal
Zredagowałem moje pytanie, aby być bardziej szczegółowe na modelu Coxa, czy Twoja odpowiedź na krzywej Kaplana_Meiera nadal obowiązuje?
Haitao Du
2

Dzięki za odpowiedź Jarle Tufto. Myślę, że powinienem być w stanie sam na to odpowiedzieć: oba stwierdzenia są fałszywe . Wygenerowana krzywa toS0(t) ale nie S(t).

Wyjściowa funkcja przeżycia S0(t) będzie równa S(t) tylko kiedy x=0. Dlatego krzywa NIE opisuje całej populacji ani żadnej osoby.

Haitao Du
źródło
0

Twoja pierwsza opcja jest poprawna. Ogólnie,S(t)=0.2 wskazuje, że 20% początkowych pacjentów przeżyło do dnia t, bez uwzględnienia cenzury . W przypadku danych ocenzurowanych nie jest poprawne stwierdzenie, że 20% wciąż żyło tego dnia , ponieważ niektóre z nich zostały wcześniej utracone, a ich status jest nieznany. Lepszym sposobem na określenie tego byłoby oszacowanie, że odsetek pacjentów nadal żyjących tego dnia wynosi 20% .

Druga opcja (szansa na przeżycie jeszcze jednego dnia, pod warunkiem przetrwania do t) jest 1h(t), z h(t) oznaczający funkcję hazardu.

Odnośnie do założeń: Myślałem, że zwykłe testy współczynników w regresji Coxa zakładają niezależność, zależnie od obserwowanych zmiennych towarzyszących? Nawet szacunki Kaplana-Meiera wydają się wymagać niezależności między czasem przeżycia a cenzurą ( odniesienie ). Ale mogę się mylić, więc poprawki są mile widziane.

juod
źródło