Estymator największej wiarygodności dla minimalnych rozkładów wykładniczych

10

Utknąłem, jak rozwiązać ten problem.

Mamy więc dwie sekwencje zmiennych losowych, i dla . Teraz i są niezależnymi rozkładami wykładniczymi o parametrach i . Jednak zamiast obserwacji i , a nie obserwuje i .XiYii=1,...,nXYλμXYZW

Z=min(Xi,Yi) i W=1 jeśli Zi=Xi i 0, jeśli Zi=Yi . I znaleźć Zamknięty formy dla estymatorów największej wiarygodności z λ i μ na podstawie Z i W . Ponadto musimy wykazać, że są to globalne maksima.

Teraz wiem, że minimum dwa niezależne wykładnicze są same w sobie wykładnicze, a współczynnik jest równy sumie wskaźników, więc wiemy, że Z jest wykładnicze z parametrem λ+μ . Zatem naszym oszacowaniem maksymalnego prawdopodobieństwa jest: λ^+μ^=Z¯ .

Ale utknąłem z tym, dokąd pójść. Wiem, że W jest rozkładem Bernoulliego z parametrem p=P(Zi=Xi) , ale nie wiem, jak przejść do przekształcenia tego w stwierdzenie dotyczące jednego z parametrów. Na przykład, co oszacowałby MLE W¯ pod względem λ i / lub μ ? Rozumiem, że jeśli Zi=Xi , to μ=0 , ale mam trudności z wymyśleniem, jak wymyślić jakieś zdanie algebraiczne, tutaj.

UPDATE 1: Tak mi powiedziano w komentarzach do uzyskania prawdopodobieństwo na wspólną dystrybucję Z i W .

Więc gdzie . Poprawny? W tym przypadku nie wiem, jak inaczej uzyskać wspólną dystrybucję, ponieważ i nie są niezależne.f(Z,W)=f(Z|W=1)p+f(Z|W=0)(1p)p=P(Zi=Xi)ZW

To daje nam, , zgodnie z definicją powyżej. Ale co teraz? Nigdzie mnie to nie prowadzi. Jeśli przejdę przez etapy obliczania prawdopodobieństwa, otrzymam: (używając i jako wielkości próbek dla każdej części mieszanki ...)f(Zi,Wi)=pλeλzi+(1p)μeμziWmn

L(λ,μ)=pmλmeλzi+(1p)nμneμzi

logL=mlogp+mlogλλzi+nlog(1p)+nlogμμzi

Jeśli wezmę pochodne cząstkowe, to mówi mi, że mój MLE szacuje na i to tylko średnia „s warunkowej . To jest,λμZW

λ^=Zim

μ^=Zin

i

p^=mn+m

Ryan Simmons
źródło
1
Czy właśnie dzisiaj, po udzieleniu odpowiedzi na podobne pytanie MLE, mogę skierować cię do tego rozwiązania w sprawie niektórych pomysłów? Zależność między pytaniami polega na tym, że twoje dane również naturalnie dzielą się na dwie nierozłączne grupy: te, gdzie i te, gdzie . Wszystko sprowadza się do spisania prawdopodobieństwa obserwacji formy ; symetria między i , i , natychmiast generuje prawdopodobieństwo danych w formularzu a następnie jesteś wyłączony. W=0W=1(Z,W)=(z,0)XYμλ(z,1)
whuber
Nie spiesz się, aby napisać maksymalne prawdopodobieństwo! Najpierw należy wyrazić łączny rozkład , a następnie wydedukować prawdopodobieństwo związane z próbką , która okazuje się być zamkniętą formą dzięki założeniu wykładniczemu. Wtedy i tylko wtedy możesz spróbować zmaksymalizować funkcję, a tym samym uzyskać maksymalne prawdopodobieństwo. (Z,W)(Zi,W)=i)
Xi'an,
@ whuber: (+1) jest to raczej proste i wiąże się z rozdziałem między i ale obie grupy obejmują zarówno i , ponieważ przynoszą informacje o obu i , ponieważ . (zi,1)(zi,0) μλ XiYiWi=I(Xi<Yi)
Xi'an
2
@ Xi'an Zgadza się - i paralele z przykładem teorii normalnej, do którego link kontynuuję, ponieważ obie grupy dostarczają informacji o wspólnym parametrze (skali), którego oszacowanie będzie w ten sposób obejmować „łączenie” danych z grup. Tutaj zobaczysz, że mówi nam, w jaki sposób szacunek (współczynnik lub skala odwrotna dla ) należy podzielić na osobne oszacowania i . σW¯λ+μZλμ
whuber
Przeczytałem drugi wątek, whuber, ale szczerze mówiąc, nie rozumiem, jak zastosować to w tym przykładzie. Z i W nie są niezależne, więc jak wyprowadzić wspólną dystrybucję?
Ryan Simmons,

Odpowiedzi:

1

Nie mam wystarczającej liczby punktów do skomentowania, więc napiszę tutaj. Myślę, że problem, który publikujesz, można zobaczyć z perspektywy analizy przeżycia, jeśli weźmiesz pod uwagę następujące kwestie:

Xi : Prawdziwy czas przeżycia,

Yi : Czas ,

Oba mają rozkład wykładniczy z i niezależnymi. Zatem to obserwowany czas przeżycia, a wskaźnik cenzury.XYZiWi

Jeśli znasz się na analizie przeżycia, uważam, że możesz zacząć od tego momentu.

Uwagi: Dobre źródło: Analiza danych dotyczących przeżycia według DRCox i D.Oakes

Poniżej znajduje się przykład: Zakładając, że pdf rozkładu czasu przeżycia to . Zatem funkcja przeżycia to: . A prawdopodobieństwo dziennika jest następujące:f(t)=ρeρtS(t)=eρt

l=ulogf(zi)+clogS(zi)

z sumowaniem odpowiednio nad ludźmi nieocenzurowanymi ( ) i cenzurowanymi ( ).uc

Z uwagi na fakt, że gdzie h (t) jest funkcją zagrożenia, można to zapisać:f(t)=h(t)S(t)

l=ulogh(zi)+logS(zi)

l=ulogρρzi

A estymator największego prawdopodobieństwa z wynosi:ρ^ρ

ρ^=d/zi gdzie jest całkowitą liczbą przypadkówdWi=1

jujae
źródło