W analizie przeżycia zakładasz, że czas przeżycia rv jest rozkładany wykładniczo. Biorąc pod uwagę teraz, że mam „wyniki” iid rv . Tylko część tych wyników jest w rzeczywistości „w pełni zrealizowana”, tzn. Pozostałe obserwacje są nadal „żywe”.
Jeśli chciałbym przeprowadzić oszacowanie ML dla parametru częstości rozkładu, jak mogę wykorzystać niezrealizowane obserwacje w spójny / odpowiedni sposób? Uważam, że nadal zawierają przydatne informacje do oszacowania.
Czy ktoś mógłby poprowadzić mnie do literatury na ten temat? Jestem pewien, że istnieje. Mam jednak problem ze znalezieniem dobrych słów kluczowych / wyszukiwanych haseł dla tego tematu.
maximum-likelihood
references
survival
censoring
exponential-family
Dobry facet Mike
źródło
źródło
Odpowiedzi:
Nadal możesz oszacować parametry, korzystając bezpośrednio z prawdopodobieństwa. Niech obserwacje będą wynosić z rozkładem wykładniczym o współczynniku i nieznanym. Funkcja gęstości to , funkcja rozkładu skumulowanego i funkcja ogona . Załóżmy, że pierwsze obserwacje są w pełni obserwowane, podczas gdy dla wiemy tylko, że dla niektórych znanych stałych dodatnichx1,…,xn λ>0 f(x;λ)=λe−λx F(x;λ)=1−e−λx G(x;λ)=1−F(x;λ)=e−λx r xr+1,…,xn xj>tj tj . Jak zawsze, prawdopodobieństwem jest „prawdopodobieństwo zaobserwowanych danych” dla obserwacji cenzurowanych, podane przez , więc pełną funkcją prawdopodobieństwa jest
Funkcja loglikelihood staje się wtedy
który ma taką samą formę jak prawdopodobieństwo dla zwykłego, w pełni obserwowanego przypadku, z wyjątkiem pierwszego terminu w miejsce . Pisanie dla średniej obserwacji i czasów cenzurowania, estymator maksymalne prawdopodobieństwo stajeP(Xj>tj)=G(tj;λ)
Aby spróbować odpowiedzieć na pytanie w komentarzach: Jeśli wszystkie obserwacje zostały ocenzurowane, to znaczy, nie czekaliśmy wystarczająco długo, aby zaobserwować jakieś zdarzenie (śmierć), co możemy zrobić? W takim przypadku , więc loglogelihood staje się co oznacza, że w maleje liniowo . Zatem maksimum musi wynosić dla ! Ale zero nie jest prawidłową wartością parametru szybkości ponieważ nie odpowiada żadnemu rozkładowi wykładniczemu. Musimy stwierdzić, że w tym przypadku nie istnieje oszacowanie maksymalnego prawdopodobieństwa! Być może można by spróbować zbudować pewien przedział ufności dlar=0
Ale w każdym razie prawdziwy wniosek z danych w tym przypadku jest taki, że powinniśmy czekać więcej czasu, aż otrzymamy jakieś zdarzenia ...
Oto, w jaki sposób możemy skonstruować (jednostronny) przedział ufności dla na wypadek, gdyby wszystkie obserwacje zostały ocenzurowane. Funkcja prawdopodobieństwa w tym przypadku to , która ma taką samą formę jak funkcja prawdopodobieństwa z eksperymentu dwumianowego, w którym osiągnęliśmy wszystkie sukcesy, czyli (patrz także Przedział ufności wokół dwumianowego oszacowania 0 lub 1 ). W takim przypadku chcemy jednostronnego przedziału ufności dla w postaci . Następnie otrzymujemy przedział dla rozwiązując .λ e−λnT pn p [p¯,1] λ logp=−λT
Otrzymujemy przedział ufności dla , rozwiązując tak, że . Daje to ostatecznie przedział ufności dla :p
źródło