Dlaczego wartość

21

tło

Jednym z najczęściej używanych słabych wcześniejszych wariantów jest odwrotna gamma o parametrach (Gelman 2006) .α=0,001,β=0,001

Jednak rozkład ten ma 90% CI około .[3)×1019,]

library(pscl)
sapply(c(0.05, 0.95), function(x) qigamma(x, 0.001, 0.001))

[1] 3.362941e+19          Inf

Na tej podstawie interpretuję, że daje niskie prawdopodobieństwo, że wariancja będzie bardzo wysoka, a bardzo małe prawdopodobieństwo, że wariancja będzie mniejsza niż 1 .P ( σ < 1 | α = 0,001 , β = 0,001 ) = 0,006jasol(0,001,0,001)P.(σ<1|α=0,001,β=0,001)=0,006

pigamma(1, 0.001, 0.001)
[1] 0.006312353

Pytanie

Czy coś pomijam, czy to rzeczywiście informacyjny przeor?

aktualizację w celu wyjaśnienia, powodem, dla którego rozważałem tę „informacyjną”, jest to, że twierdzi ona bardzo mocno, że wariancja jest ogromna i znacznie wykracza poza skalę prawie każdej wariancji kiedykolwiek zmierzonej.

działania następcze, czy metaanaliza dużej liczby oszacowań wariancji stanowiłaby bardziej rozsądny wcześniej?


Odniesienie

Gelman 2006. Wcześniejsze rozkłady parametrów wariancji w modelach hierarchicznych . Analiza bayesowska 1 (3): 515–533

David LeBauer
źródło
1
„Prawdziwy” nieinformacyjny przeor nie jest dystrybucją. Nie ma więc wcześniejszego prawdopodobieństwa, takiego jak P (sigma <1).
Stéphane Laurent,

Odpowiedzi:

38

Stosując odwrotny rozkład gamma, otrzymujemy:

p(σ2)|α,β)(σ2))-α-1exp(-βσ2))

Łatwo widać, że jeśli i α 0, wówczas odwrotna gamma zbliży się do Jeffreysa wcześniej. Ta dystrybucja nazywa się „nieinformacyjną”, ponieważ jest właściwym przybliżeniem do wcześniejszego Jeffreysaβ0α0

p(σ2))1σ2)

Co nie jest pouczające dla parametrów skali, patrz na przykład tutaj strona 18 , ponieważ ten przeor jest jedynym, który pozostaje niezmienny przy zmianie skali (zauważ, że przybliżenie nie jest niezmienne). Ma to nieokreśloną całkę co pokazuje, że niewłaściwe jest, jeśli zakres σ 2 obejmuje albo 0, albo . Ale te przypadki są tylko problemami w matematyce - nie w prawdziwym świecie. Nigdy nie obserwuj nieskończonej wartości wariancji, a jeśli zaobserwowana wariancja wynosi zero, masz doskonałe dane! Możesz ustawić dolny limit równy L > 0 i górny limit równy Ulog(σ2))σ2)0L.>0 , a Twoja dystrybucja jest właściwa.U<

Choć może wydawać się dziwne, że jest to „nieinformacyjne”, ponieważ woli mniejszą wariancję od dużych, ale jest to tylko na jedną skalę. Możesz pokazać, że ma niewłaściwie jednolity rozkład. Dlatego ten przeor nie faworyzuje żadnej skali w stosunku do innejlog(σ2))

Chociaż nie jest to bezpośrednio związane z twoim pytaniem, sugerowałbym „lepszy” rozkład nieinformacyjny poprzez wybranie górnej i dolnej granicy i U w Jeffreys przed zamiast α i β . Zazwyczaj granice można dość łatwo ustalić przy odrobinie przemyślenia, co tak naprawdę oznacza σ 2 w świecie rzeczywistym. Gdyby to był błąd w jakiejś wielkości fizycznej - L nie może być mniejszy niż rozmiar atomu lub najmniejszy rozmiar, jaki można zaobserwować w eksperymencie. Dalsze UL.Uαβσ2)L.Unie może być większy niż ziemia (lub słońce, jeśli chcesz być naprawdę konserwatywny). W ten sposób można utrzymać właściwości na niezmienność oraz jej łatwiejsze przed próbki z: odbioru , a następnie symulowana wartość jako Ď 2 ( b ) = exp ( q ( b ) ) .q(b)Unjafaorm(log(L.),log(U))σ(b)2)=exp(q(b))

prawdopodobieństwo prawdopodobieństwa
źródło
5
+1 za nie tylko udzielenie odpowiedzi na pytanie, ale także udzielenie przydatnych porad.
whuber
losol(σ)
Beta2(1,1)F1,1Beta2(0,0)
probabilityislogic
1
[0,]σexp(U(log(L),log(U))σU(L,U)
David LeBauer,
(0,)α=1,β=1/2
10

Jest dość blisko mieszkania. Jego mediana wynosi 1,9 E298, prawie największa liczba, jaką można reprezentować w arytmetyce pływającej o podwójnej precyzji. Jak zauważyłeś, prawdopodobieństwo, które przypisuje każdemu interwałowi, który nie jest tak naprawdę ogromny, jest naprawdę niewielkie. Trudno jest uzyskać mniej informacji niż to!

Whuber
źródło
Dziękuję za wyjaśnienie. Miałem problemy z konwergencją i zdziwiłem się, że tak wiele zmiennych, z którymi pracuję, ma średnie <1000 (tzn. Jeśli coś ma> 1000 g, to jest mierzone w kg), a wariancje są mniej więcej tego samego rzędu wielkość. Zdaję sobie zatem sprawę, że potrzebuję więcej priorytetów, które zawierają te informacje, nawet jeśli tak naprawdę nie mam dobrej wcześniejszej wiedzy na temat ich wartości ani sposobu podziału.
David LeBauer,
W zależności od modelu, twój tyłek może być bardzo blisko niewłaściwego korzystania z tego wcześniejszego
JMS