Porównanie CPH, modelu przyspieszonego czasu awarii lub sieci neuronowych do analizy przeżycia

10

Jestem nowy w analizie przeżycia, a ostatnio dowiedziałem się, że istnieją różne sposoby, aby osiągnąć określony cel. Interesuje mnie faktyczne wdrożenie i odpowiedniość tych metod.

Przedstawiono mi tradycyjne Cox Proporcjonalne zagrożenia , modele przyspieszonego czasu awarii i sieci neuronowe (perceptron wielowarstwowy) jako metody pozwalające na przeżycie pacjenta, biorąc pod uwagę jego czas, status i inne dane medyczne. Badanie ma zostać określone za pięć lat, a jego celem jest coroczne podawanie ryzyka przeżycia w celu uzyskania nowych zapisów.

Znalazłem dwa przypadki, w których inne metody zostały wybrane w stosunku do Cox PH:

  1. Znalazłem „ Jak uzyskać prognozy dotyczące czasu przeżycia z modelu PH Coxa ” i wspomniano, że:

    Jeśli jesteś szczególnie zainteresowany uzyskaniem oszacowań prawdopodobieństwa przeżycia w określonych punktach czasowych, skierowałbym cię w stronę parametrycznych modeli przeżycia (czyli modeli przyspieszonego czasu awarii) . Są one zaimplementowane w pakiecie przeżycia dla R i dają parametryczne rozkłady czasu przeżycia, w których możesz po prostu podłączyć interesujący Cię czas i odzyskać prawdopodobieństwo przeżycia.

    Poszedłem na zalecaną stronę i znalazłem jedną w survivalpakiecie - funkcję survreg.

  2. W tym komentarzu zasugerowano sieci neuronowe :

    ... Jedną z zalet podejść sieci neuronowej do analizy przeżycia jest to, że nie polegają one na założeniach leżących u podstaw analizy Coxa ...

    Inna osoba z pytaniem „ Model sieci neuronowej R z wektorem docelowym jako wyjściem zawierającym prognozy przeżycia ” podał wyczerpujący sposób określania przeżycia zarówno w sieciach neuronowych, jak i PH Coxa.

    Kod R do uzyskania przetrwania wyglądałby następująco:

    mymodel <- neuralnet(T1+T2+T3+T4+T5~covar1+covar2+covar3+..., data=mydata, hidden=1)
    compute(mymodel,data=mydata)
  3. Poszedłem na fora R i znalazłem tę odpowiedź w pytaniu „ Prognozuj.coxph i przewiduj.survreg :

    Rzeczywiście, z predict()funkcji coxphnie można uzyskać bezpośrednich prognoz „czasowych”, a jedynie liniowe i wykładnicze oceny ryzyka. Wynika to z tego, że aby uzyskać czas, należy obliczyć podstawowe zagrożenie i nie jest to proste, ponieważ jest ukryte w modelu Coxa.

Zastanawiałem się, czy który z tych trzech (lub dwóch, biorąc pod uwagę argumenty dotyczące Cox PH), jest najlepszy do uzyskania procentu przeżycia w interesujących okresach? Nie jestem pewien, które z nich zastosować w analizie przeżycia.

Final Litiu
źródło

Odpowiedzi:

9

To zależy od tego, dlaczego robisz modele. Dwa główne powody do konstruowania modeli przeżycia to (1) do prognozowania lub (2) do modelowania wielkości efektu zmiennych towarzyszących.

Jeśli chcesz użyć ich w ustawieniu predykcyjnym, w którym chcesz uzyskać oczekiwany czas przeżycia przy danym zestawie zmiennych towarzyszących, sieci neuronowe są prawdopodobnie najlepszym wyborem, ponieważ są uniwersalnymi aproksymatorami i przyjmują mniej założeń niż zwykłe (pół-) parametryczne modele. Inną opcją, która jest mniej popularna, ale nie mniej wydajna, jest obsługa maszyn wektorowych .

Jeśli modelujesz w celu oszacowania wielkości efektów, sieci neuronowe nie będą zbyt przydatne. W tym celu można zastosować zarówno proporcjonalne zagrożenia Coxa, jak i modele przyspieszonego czasu awarii. Modele PH Coxa są zdecydowanie najczęściej stosowane w warunkach klinicznych, w których współczynnik ryzyka daje miarę wielkości efektu dla każdej zmiennej / interakcji. Jednak w ustawieniach inżynierskich modele AFT są bronią z wyboru.

Marc Claesen
źródło
1
Dziękuję za Twoją odpowiedź! Powiedziałeś to dokładnie - „ aby uzyskać oczekiwany czas przeżycia, biorąc pod uwagę zestaw zmiennych towarzyszących ”. W swoim badaniu będę musiał korzystać z sieci neuronowych i maszyn SVM.
Final Litiu
@Marc Claesen: Model PH Coxa zapewnia P (czas przeżycia> t). Czy nie jest możliwe pobranie stamtąd pdf czasu przeżycia i pobranie próbki z pdf?
statBeginner
@Marc Claesen Zakładam, że sieci neuronowe nie mogą być bezpośrednio zastosowane do problemu analizy przeżycia, ale problem analizy przeżycia powinien być 1. przekształcony w problem klasyfikacji lub regresji. Czy możesz zatem wyjaśnić, w jaki sposób problem analizy przeżycia można przekształcić w problem klasyfikacji lub regresji, aby można było zastosować sieci neuronowe? Proszę odpowiedzieć tutaj, jeśli to możliwe stats.stackexchange.com/questions/199549/...
GeorgeOfTheRF