Próbuję uzyskać intuicję dla każdej z głównych funkcji w nauce aktuarialnej (szczególnie dla modelu proporcjonalnych zagrożeń Coxa). Oto co mam do tej pory:
- : począwszy od godziny rozpoczęcia, rozkład prawdopodobieństwa, kiedy umrzesz.
- : tylko rozkład skumulowany. W chwili jaki procent populacji będzie martwy?
- : . W chwili jaki procent populacji będzie żył?
- : funkcja zagrożenia. W danym czasie , wciąż żyjących, można to wykorzystać do oszacowania, ilu ludzi umrze w następnym przedziale czasowym lub, jeśli w przedziale -> 0, „natychmiastowe” prawdopodobieństwo śmierci.
- : zagrożenie skumulowane. Brak pomysłu.
Jaka jest idea łączenia wartości zagrożenia, zwłaszcza gdy są one ciągłe? Jeśli użyjemy dyskretnego przykładu ze śmiertelnością w czterech porach roku, a funkcja hazardu wygląda następująco:
- Od wiosny wszyscy żyją, a 20% umrze
- Teraz w lecie spośród pozostałych 50% umrze
- Jesienią spośród pozostałych 75% umrze
- Ostatni sezon to zima. Z pozostałych 100% umrze
Zatem skumulowane zagrożenie wynosi 20%, 70%, 145%, 245%? Co to znaczy i dlaczego jest to przydatne?
Odpowiedzi:
Łączenie umierających proporcji nie powoduje skumulowanego ryzyka. Współczynnik ryzyka w czasie ciągłym jest warunkowym prawdopodobieństwem, że w bardzo krótkim okresie nastąpi zdarzenie:
Zagrożenie skumulowane to całkowanie (chwilowe) współczynnika ryzyka na przestrzeni wieków / czasu. To jak sumowanie prawdopodobieństw, ale ponieważ jest bardzo mała, prawdopodobieństwa te są również małymi liczbami (np. Wskaźnik ryzyka śmierci może wynosić około 0,004 w wieku około 30). Współczynnik ryzyka zależy od tego, czy zdarzenie nie miało miejsca przed , więc dla populacji może sumować się powyżej 1.Δt t
Możesz spojrzeć na tabelę śmiertelności ludzi, chociaż jest to dyskretna formuła czasowa i spróbować zgromadzić .mx
Jeśli używasz R, oto mały przykład przybliżenia tych funkcji na podstawie liczby zgonów w każdym rocznym przedziale wiekowym:
Mam nadzieję że to pomoże.
źródło
Książka „Wprowadzenie do analizy przeżycia za pomocą Staty” (wydanie drugie) autorstwa Mario Clevesa zawiera dobry rozdział na ten temat.
Rozdział o książkach Google można znaleźć na str. 13–15. Ale radziłbym przeczytać cały rozdział 2.
Oto krótki formularz:
źródło
Chciałbym Hazard przypuszczenie, że jest godny uwagi ze względu na jej stosowanie w działkach diagnostycznych:
źródło
Parafrazując to, co mówi @Scortchi, chciałbym podkreślić, że funkcja kumulatywnego hazardu nie ma dobrej interpretacji i jako taka nie próbowałabym używać jej jako sposobu interpretacji wyników; powiedzenie badaczowi niebędącemu statystyką, że skumulowane zagrożenia są różne, najprawdopodobniej da odpowiedź „mm-hm”, a wtedy już nigdy nie zapytają o przedmiot, i to nie w dobry sposób.
Jednak skumulowana funkcja hazardu okazuje się bardzo przydatna matematycznie, na przykład jako ogólny sposób powiązania funkcji hazardu z funkcją przetrwania. Dlatego ważne jest, aby wiedzieć, czym jest skumulowane zagrożenie i jak można je wykorzystać w różnych metodach statystycznych. Ale ogólnie rzecz biorąc, nie sądzę, że szczególnie przydatne jest myślenie o rzeczywistych danych w kategoriach skumulowanych zagrożeń.
źródło