Jak interpretujesz krzywą przeżycia z proporcjonalnego modelu hazardu Coxa?
W tym przykładzie zabawki załóżmy, że mamy proporcjonalny model hazardu Coxa dla age
zmiennej w kidney
danych i generujemy krzywą przeżycia.
library(survival)
fit <- coxph(Surv(time, status)~age, data=kidney)
plot(conf.int="none", survfit(fit))
grid()
Na przykład o czasie , które stwierdzenie jest prawdziwe? czy oba są w błędzie?
Oświadczenie 1: pozostanie nam 20% przedmiotów (np. Jeśli mamy) ludzie, za dnia powinniśmy mieć około lewo),
Oświadczenie 2: Dla jednej osoby ma on / ona szansa na przeżycie w dzień .
Moja próba: nie sądzę, aby te dwa stwierdzenia były takie same (poprawcie mnie, jeśli się mylę), ponieważ nie mamy założenia iid (czas przeżycia dla wszystkich ludzi NIE czerpie z jednej dystrybucji niezależnie). Jest ona podobna do regresji logistycznej w moje pytanie tutaj , wskaźnik szkodliwości dla każdej osoby zależy od dla tej osoby.
źródło
Odpowiedzi:
Ponieważ zagrożenie zależy od zmiennych towarzyszących, podobnie funkcja przetrwania. Model zakłada, że funkcja hazardu osoby z wektorem zmiennym towarzyszącymx jest
Podane szacunkiβ^ i S^0(t) współczynników regresji i wyjściowej funkcji przeżycia, oszacuj funkcję przeżycia dla osoby z wektorem współzmiennym x jest dany przez S^(t;x)=S^0(t)eβ^′x .
Oblicz to w R, określ wartość zmiennych towarzyszących w
newdata
argumencie. Na przykład, jeśli chcesz funkcji przeżycia dla osób w wieku = 70, w R, zróbJeśli, tak jak ty, pominieszS0(t)eβ′x¯ .
newdata
argument, jego wartość domyślna będzie równa średnim wartościom zmiennych towarzyszących w próbce (patrz?survfit.coxph
). To, co pokazano na wykresie, jest szacunkoweźródło
survfit.coxph
poprawiłem błąd w mojej odpowiedzi, patrz aktualizacja.W najczystszej postaci krzywa Kaplana-Meiera w twoim przykładzie nie zawiera żadnej z powyższych instrukcji.
Pierwsze oświadczenie sprawia, że przyszłościowy projekcja będzie miała . Podstawowa krzywa przetrwania opisuje tylko przeszłość, twoją próbkę. Tak, 20% twojej próbki przeżyło do 200 dnia. Czy 20% przetrwa w ciągu następnych 200 dni? Niekoniecznie.
Aby stworzyć to stwierdzenie, musisz dodać więcej założeń, zbudować model itp. Model nie musi nawet być statystyczny w sensie podobnym do regresji logistycznej. Na przykład może to być PDE w epidemiologii itp.
Twoje drugie stwierdzenie opiera się prawdopodobnie na pewnym założeniu jednorodności: wszyscy ludzie są tacy sami.
źródło
Dzięki za odpowiedź Jarle Tufto. Myślę, że powinienem być w stanie sam na to odpowiedzieć: oba stwierdzenia są fałszywe . Wygenerowana krzywa toS0(t) ale nie S(t) .
Wyjściowa funkcja przeżyciaS0(t) będzie równa S(t) tylko kiedy x=0 . Dlatego krzywa NIE opisuje całej populacji ani żadnej osoby.
źródło
Twoja pierwsza opcja jest poprawna. Ogólnie,S(t)=0.2 wskazuje, że 20% początkowych pacjentów przeżyło do dnia t , bez uwzględnienia cenzury . W przypadku danych ocenzurowanych nie jest poprawne stwierdzenie, że 20% wciąż żyło tego dnia , ponieważ niektóre z nich zostały wcześniej utracone, a ich status jest nieznany. Lepszym sposobem na określenie tego byłoby oszacowanie, że odsetek pacjentów nadal żyjących tego dnia wynosi 20% .
Druga opcja (szansa na przeżycie jeszcze jednego dnia, pod warunkiem przetrwania dot ) jest 1−h(t) , z h(t) oznaczający funkcję hazardu.
Odnośnie do założeń: Myślałem, że zwykłe testy współczynników w regresji Coxa zakładają niezależność, zależnie od obserwowanych zmiennych towarzyszących? Nawet szacunki Kaplana-Meiera wydają się wymagać niezależności między czasem przeżycia a cenzurą ( odniesienie ). Ale mogę się mylić, więc poprawki są mile widziane.
źródło