Czy dla REML istnieje interpretacja bayesowska?

14

Czy dostępna jest bayesowska interpretacja REML? Według mojej intuicji, REML ma silne podobieństwo do tak zwanych empirycznych procedur estymacji Bayesa i zastanawiam się, czy wykazano jakąś asymptotyczną równoważność (powiedzmy, w ramach odpowiedniej klasy priorytetów). Zarówno empiryczne Bayesa, jak i REML wydają się na przykład „kompromitowanym” podejściem estymacyjnym podejmowanym na przykład w obliczu uciążliwych parametrów .

Głównie to, czego szukam w tym pytaniu, to wgląd na wysokim szczeblu, który tego rodzaju argumenty zwykle dają. Oczywiście, jeżeli z jakiegoś powodu nie można z powodzeniem zastosować argumentu tego rodzaju dla REML, wyjaśnienie, dlaczego tak jest, również zapewni pożądany wgląd!

David C. Norris
źródło
Ten artykuł wydaje się być istotny: Foulley J. (1993). Prosty argument pokazujący, jak uzyskać ograniczone maksymalne prawdopodobieństwo. J. Dairy Sci. 76, 2320–2324. 10,3168 / jds.S0022-0302 (93) 77569-4 sciencedirect.com/science/article/pii/...
DJW

Odpowiedzi:

5

Interpretacje bayesowskie istnieją tylko w ramach analizy bayesowskiej, dla estymatorów związanych z rozkładem a posteriori. Stąd jedynym sposobem, aby estymatorowi REML można było nadać interpretację bayesowską (tj. Interpretację jako estymator wzięty z tyłu), to jeśli weźmiemy pod uwagę ograniczone prawdopodobieństwo logarytmiczne w analizie REML jako logarytmicznie tylną w odpowiednim Analiza Bayesa; w tym przypadku estymator REML byłby estymatorem MAP z teorii bayesowskiej, z odpowiadającą mu interpretacją bayesowską.


x(θ,ν)=(θ,ν)+RE(θ)RE(θ)θνπ(θ,ν)exp((θ,ν))

π(θ|x)Lx(θ,ν)π(θ,ν)dνexp(x(θ,ν))exp((θ,ν))dν=exp(x(θ,ν)(θ,ν))dν=exp((θ,ν)+RE(θ)(θ,ν))dν=exp(RE(θ))dν=LRE(θ)dνLRE(θ).

To daje nam:

θ^MAP=argmaxθπ(θ|x)=argmaxθLRE(θ)=θ^REML.

Ten wynik pozwala nam interpretować estymator REML jako estymator MAP, więc poprawną interpretacją bayesowską estymatora REML jest to, że jest to estymator, który maksymalizuje gęstość a posteriori zgodnie z powyższym uprzednim .

Po zilustrowaniu metody nadania estymatorowi REML interpretacji bayesowskiej zauważamy, że z tym podejściem wiążą się duże problemy. Jednym z problemów jest to, że uprzednia formacja jest tworzona przy użyciu komponentu wiarygodności dziennika , który zależy od danych. Dlatego „uprzedni” niezbędny do uzyskania tej interpretacji nie jest prawdziwym uprzednim, w sensie bycia funkcją, którą można utworzyć przed obejrzeniem danych. Innym problemem jest to, że przejęcie często jest niewłaściwe (tzn. Nie integruje się z jednym) i może faktycznie wzrosnąć, ponieważ wartości parametrów stają się ekstremalne. (Poniżej pokażemy przykład tego.)(θ,ν)

Na podstawie tych problemów można argumentować, że estymator REML nie ma rozsądnej interpretacji bayesowskiej . Alternatywnie można argumentować, że estymator REML nadal utrzymuje powyższą interpretację bayesowską, będąc maksymalnie estymatorem a posteriori pod „uprzednim”, który musi przypadkowo zrównać się z obserwowanymi danymi w określonej formie i może być wyjątkowo niewłaściwy.


Ilustracja z normalnymi danymi: Klasyczny przykład oszacowania REML dotyczy przypadku normalnych danych gdzie interesuje Cię precyzja a średnia jest uciążliwym parametrem. W tym przypadku masz funkcję log-prawdopodobieństwo:x1,...,xnN(ν,1/θ)θν

x(ν,θ)=n2lnθθ2i=1n(xiν)2.

W REML podzieliliśmy to prawdopodobieństwo dziennika na dwa składniki:

(ν,θ)=n2lnθθ2i=1n(xiν)2RE(θ)=n12lnθθ2i=1n(xix¯)2.

Otrzymujemy estymator REML dla parametru dokładności, maksymalizując resztkowe prawdopodobieństwo, co daje obiektywny estymator dla wariancji:

1θ^REML=1n1i=1n(xix¯)2.

W takim przypadku estymator REML będzie odpowiadał estymatorowi MAP dla „wcześniejszej” gęstości:

π(θ)θn/2exp(θ2i=1n(xiν)2).

Jak widać, to „wcześniejsze” tak naprawdę zależy od obserwowanych wartości danych, więc nie można go właściwie uformować przed obejrzeniem danych. Co więcej, widzimy, że jest to wyraźnie „niewłaściwa” wcześniejsza zasada, która kładzie coraz większy nacisk na ekstremalne wartości i . (W rzeczywistości ten przeor jest dość szalony.) Jeśli przez „zbieg okoliczności” utworzysz przeora, który okazał się odpowiadać temu wynikowi, to estymator REML byłby estymatorem MAP pod tym przełożeniem, a zatem miałby interpretację bayesowską jako estymator, który maksymalizuje tylną pod tym uprzednim.θν

Ben - Przywróć Monikę
źródło
3
Cóż za niezwykle jasna odpowiedź! W rezultacie rozumiem REML znacznie lepiej, co w dużej mierze było moim głównym celem. Wydaje się, że twoje podejście do otwarcia argumentu polegało głównie na dokonaniu identyfikacji, a następnie „rozwiązaniu problemu” w stosunku do przeora. Następnie przystępujesz do niszczenia tego przeora, co wydaje mi się krytyką (z perspektywy Bayesa) skierowaną przeciwko REML. Pięknie zrobione!
David C. Norris,
3
Tak, zastosowałem tę metodę. Przez analogię zwykle podajemy MLE interpretację bayesowską tą samą metodą --- tj. Przez wykrycie, że MLE jest MAP pod jednolitym uprzednim. Ogólnie rzecz biorąc, gdy chcemy znaleźć analog Bayesa do klasycznego estymatora, który powstaje w wyniku maksymalizacji jakiejś funkcji, po prostu ustawiamy tę funkcję na tylną, a następnie rozwiązujemy wcześniej. Jeśli daje to rozsądne wcześniejsze, mamy dobrą interpretację bayesowską; jeśli przeor jest szalony (jak w przypadku REML), to mamy dobry argument, że nie ma dobrej interpretacji bayesowskiej.
Ben - Przywróć Monikę