Czy MLE z

10

Załóżmy, że ma plik pdf(X,Y)

fθ(x,y)=e(x/θ+θy)1x>0,y>0,θ>0

Gęstość próbki pobranej z tej populacji jest zatem(X,Y)=(Xi,Yi)1in

gθ(x,y)=i=1nfθ(xi,yi)=exp[i=1n(xiθ+θyi)]1x1,,xn,y1,,yn>0=exp[nx¯θθny¯]1x(1),y(1)>0,θ>0

Estymator największego prawdopodobieństwa można uzyskać jakoθ

θ^(X,Y)=X¯Y¯

Chcę wiedzieć, czy ograniczenie tego MLE jest normalne, czy nie.

Oczywiste jest, że wystarczająca statystyka dla na podstawie próbki to .θ(X¯,Y¯)

Powiedziałbym teraz, że MLE jest asymptotycznie normalny bez wątpienia, jeśli byłby członkiem zwykłej jednoparametrowej rodziny wykładniczej. Nie sądzę, żeby tak było, częściowo dlatego, że mamy dwuwymiarową wystarczającą statystykę dla jednowymiarowego parametru (jak na przykład w rozkładzie ).N(θ,θ2)

Korzystając z faktu, że i są w rzeczywistości niezależnymi zmiennymi wykładniczymi, mogę wykazać, że dokładny rozkład jest taki, żeXYθθ^

θ^θ=dF, where FF2n,2n

Nie mogę stąd znaleźć ograniczenia dystrybucji.

Zamiast tego mogę argumentować przez WLLN, że i , tak że .X¯PθY¯P1/θ θθ^Pθ

To mówi mi, że zbiega się w dystrybucji do . Nie jest to jednak niespodzianką, ponieważ jest „dobrym” estymatorem . Ten wynik nie jest wystarczająco silny, aby stwierdzić, czy coś takiego jak jest asymptotycznie normalne, czy nie. Nie mogłem też wymyślić rozsądnego argumentu za pomocą CLT.θ^θ θ θθ^θn(θ^θ)

Pozostaje więc pytanie, czy rozkład macierzysty spełnia tutaj warunki regularności, aby rozkład ograniczający MLE był normalny.

UpartyAtom
źródło
Empirycznie wydaje się, że jest bardzo zbliżona do normy. Możesz łatwiej ustawić na (jest to tylko współczynnik skalowania), a następnie zastanowić się, czy rozkład pierwiastka kwadratowego ze współczynnika próby średnich wykładniczych zmiennych losowych jest asymptotycznie normalny. Przy zastosowaniu metody delta odpowiada to rozkładowi współczynnika próbkowania iid wykładniczych zmiennych losowych, które są asymptotycznie normalne. To odpowiada rozkładowi dwóch losowych zmiennych gamma iid, które są asymptotycznie normalne wraz ze wzrostem parametru kształtu. 1θ1
Henry
Asymptotyczna normalność MLE nie ma nic wspólnego z rodzinami wykładniczymi. Intuicyjnie, aby asymptotyczna normalność się utrzymała, wystarczy upewnić się, że nie ma szans, że rozwiązanie znajdzie się w pobliżu granicy przestrzeni parametrów.
Whuber
@whuber O ile mi wiadomo, pliki pdf, które należą do kanonicznej rodziny wykładniczej, prawie zawsze mają MLE, które są asymptotycznie normalne (nie dlatego, że wynika to z rodziny exp). Właśnie to połączenie chciałem wskazać.
StubbornAtom
1
Racja: ale połączenie jest jednokierunkowe. Wyniki asymptotyczne dla MLE są znacznie bardziej ogólne i dlatego próbowałem zasugerować, że spojrzenie w tym ogólnym kierunku, zamiast skupiać się na właściwościach rodziny wykładniczej, może być bardziej owocnym badaniem.
Whuber
Dowód przy użyciu wielowymiarowej metody CLT i delty jest również możliwy, tak jak tutaj .
StubbornAtom

Odpowiedzi:

3

Bezpośredni dowód na asymptotyczną normalność:

Prawdopodobieństwo dziennika jest tutaj

L=nx¯θθny¯

Pierwszą i drugą pochodną są

Lθ=nx¯θ2ny¯,2Lθ2=2nx¯θ3

MLE spełniaθ^n

L(θ^n)θ=0

Zastosowanie rozszerzenia wartości średniej wokół wartości rzeczywistej θ0 którą mamy

L(θ^n)θ=L(θ0)θ+2L(θ~n)θ2(θ^nθ0)=0

dla niektórych pomiędzy aθ~nθ^nθ0 . Mamy zmiany w aranżacji,

(θ^nθ0)=(2L(θ~n)θ2)1L(θ0)θ

Ale w naszym przypadku jednoparametrowym odwrotność jest tylko odwrotnością, więc wstawiając również specyficzne wyrażenia pochodnych,

(θ^nθ0)=θ~n32nx¯(nx¯θ02ny¯)

n(θ^nθ0)=θ~n32x¯θ02n(x¯θ02y¯)

n(θ^nθ0)=θ~n32x¯θ02(n1/2i=1n(xiθ02yi))

Wariant sumy jest

Var(i=1n(xiθ02yi))=2nθ02

Manipulując wyrażeniem, które możemy napisać, używającSn do sumy elementów iid,

n(θ^nθ0)=(θ~n32x¯θ0)i=1n(xiθ02yi)n2θ0

n(θ^nθ0)=(θ~n32x¯θ0)SnVar(Sn)

Co więcej, mamy , więc . Mamy więc przedmiot klasycznego CLT i można sprawdzić, czy warunek Lindeberga jest spełniony. Wynika, żeE(xiθ02yi)=0E(Sn)=0

SnVar(Sn)dN(0,1)

Ze względu na spójność estymatora mamy również

(θ~n32x¯θ0)pθ02

i przez Twierdzenie Słuckiego dochodzimy do

n(θ^nθ0)dN(0,θ02/2)

Miły. Podwój informacje, połowę wariancji (w porównaniu do przypadku, w którym oszacowalibyśmyθ0 na podstawie próbki z pojedynczej zmiennej losowej).

PS: Fakt, że w powyższych wyrażeniach pojawia się w mianowniku, wskazuje na komentarz @ whubera, że ​​asymptotyczna normalność MLE wymaga, aby nieznany parametr znajdował się poza granicą przestrzeni parametrów (w naszym przypadku od zera).θ0

Alecos Papadopoulos
źródło
Przepraszam za późną odpowiedź. Przez cały ten czas zastanawiałem się, czy jest to zakrzywiona wykładnicza rodzina, więc MLE może zachowywać się inaczej.
StubbornAtom
1
@StubbornAtom Asymptotyczna normalność z pewnością zostaje utracona, gdy szacowany parametr znajduje się na granicy parametru (całkiem intuicyjny wynik, jeśli się nad tym zastanowić).
Alecos Papadopoulos