Winbugs i inne MCMC bez informacji do wcześniejszej dystrybucji

10

Co dzieje się, gdy nie masz pojęcia o rozkładzie parametrów? Jakie podejście powinniśmy zastosować?

Przez większość czasu dążymy do podkreślenia, czy dana zmienna ma jakikolwiek wpływ na obecność / nieobecność określonego gatunku, a zmienna jest akceptowana lub nie, zgodnie ze znaczeniem zmiennej. Oznacza to, że przez większość czasu nie myślimy o oczekiwanym rozkładzie, jaki powinien mieć parametr.

Czy słuszne jest założenie, że wszystkie parametry są zgodne z rozkładem normalnym, kiedy wiem tylko, że b1, b2, b3 i b4 powinny różnić się między -2 a 2, a b0 może zmieniać się między -5 a 5?

model {
    # N observations
    for (i in 1:N) {
        species[i] ~ dbern(p[i])
        logit(p[i]) <- b0 + b1*var1[i] + b2*var2[i] + 
            b3*var3[i] + b4*var4[i]
    }
    # Priors
    b0     ~ dnorm(0,10)
    b1   ~ dnorm(0,10)
    b2 ~ dnorm(0,10)
    b3  ~ dnorm(0,10)
    b4  ~ dnorm(0,10)
}
Gago-Silva
źródło
Jeśli nie masz wcześniejszego, nie możesz użyć wnioskowania bayesowskiego. I stąd metodologia MCMC,
Xi'an

Odpowiedzi:

6

Parametry w predyktorze liniowym są podzielone na t . Gdy liczba rekordów osiągnie nieskończoność, zbiega się do rozkładu normalnego. Więc tak, zwykle uważa się za prawidłowe założenie normalnego rozkładu parametrów.

W każdym razie, w statystykach bayesowskich, nie musisz zakładać rozkładu parametrów. Zwykle określa się tak zwane nieinformacyjne priory . W każdym przypadku zalecane są inne nieinformacyjne priory. W takim przypadku ludzie często używają czegoś takiego (możesz oczywiście poprawić wartości):

dunif(-100000, 100000)

lub

dnorm(0, 1/10^10)

Drugi jest preferowany, ponieważ nie jest ograniczony do konkretnych wartości. W przypadku nieinformacyjnych priorów nie ponosisz ryzyka. Możesz oczywiście ograniczyć je do określonego przedziału czasowego, ale bądź ostrożny.

Podaj więc nieinformacyjną wcześniej, a rozkład parametrów wyjdzie sam! Nie trzeba zakładać żadnych założeń.

Ciekawy
źródło
1
Niestety nie jest to do końca prawdą: granice w mundurze poprzedzającym powyżej mogą wpływać na wynik, szczególnie. podczas testowania hipotez. W mojej opinii jest to wada Winbugs.
Xi'an
@ Xi'an - oczywiście tak mówię. Dlatego wolę w tym przypadku „normalną płaską” - tj. Drugą opcję. Prawdopodobnie z poprawieniem drugiego parametru.
Ciekawy
1
Hmmm, to wcale nie jest płaskie ...
Xi'an
Jesteś darmowy dnorm(0, 1/10^10)lub cokolwiek
Ciekawy
8

Niestety nieszkodliwe pozorne priory mogą być bardzo niebezpieczne (a nawet oszukały niektórych wytrawnych Bayesian).

Ten ostatni artykuł stanowi miłe wprowadzenie wraz z metodami kreślenia w celu wizualizacji wcześniejszego i tylnego (zwykle marginalne priory / posterior dla parametru (ów)).

Ukryte niebezpieczeństwa związane z określeniem nieinformacyjnych duchownych. John W. Seaman III, John W. Seaman Jr. i James D. Stamey The American Statistician Volume 66, Issue 2, May 2012, strony 77-84. http://amstat.tandfonline.com/doi/full/10.1080/00031305.2012.695938

Moim zdaniem takie wykresy powinny być obowiązkowe w każdej rzeczywistej analizie bayesowskiej, nawet jeśli analityk ich nie potrzebuje - to, co dzieje się w analizie bayesowskiej, powinno być jasne dla większości czytelników.

phaneron
źródło
2
dobry link, szkoda, że ​​nie jest dostępny za darmo.
Ciekawy
6

Analiza wrażliwości jest zwykle dobrym rozwiązaniem: wypróbuj różne priorytety i zobacz, jak zmienią się Twoje wyniki. Jeśli są solidne, prawdopodobnie będziesz w stanie przekonać wiele osób o swoich wynikach. W przeciwnym razie prawdopodobnie będziesz chciał jakoś określić ilościowo, w jaki sposób priory zmieniają wyniki.

szaleństwo
źródło