Co dzieje się, gdy nie masz pojęcia o rozkładzie parametrów? Jakie podejście powinniśmy zastosować?
Przez większość czasu dążymy do podkreślenia, czy dana zmienna ma jakikolwiek wpływ na obecność / nieobecność określonego gatunku, a zmienna jest akceptowana lub nie, zgodnie ze znaczeniem zmiennej. Oznacza to, że przez większość czasu nie myślimy o oczekiwanym rozkładzie, jaki powinien mieć parametr.
Czy słuszne jest założenie, że wszystkie parametry są zgodne z rozkładem normalnym, kiedy wiem tylko, że b1, b2, b3 i b4 powinny różnić się między -2 a 2, a b0 może zmieniać się między -5 a 5?
model {
# N observations
for (i in 1:N) {
species[i] ~ dbern(p[i])
logit(p[i]) <- b0 + b1*var1[i] + b2*var2[i] +
b3*var3[i] + b4*var4[i]
}
# Priors
b0 ~ dnorm(0,10)
b1 ~ dnorm(0,10)
b2 ~ dnorm(0,10)
b3 ~ dnorm(0,10)
b4 ~ dnorm(0,10)
}
Odpowiedzi:
Parametry w predyktorze liniowym są podzielone na t . Gdy liczba rekordów osiągnie nieskończoność, zbiega się do rozkładu normalnego. Więc tak, zwykle uważa się za prawidłowe założenie normalnego rozkładu parametrów.
W każdym razie, w statystykach bayesowskich, nie musisz zakładać rozkładu parametrów. Zwykle określa się tak zwane nieinformacyjne priory . W każdym przypadku zalecane są inne nieinformacyjne priory. W takim przypadku ludzie często używają czegoś takiego (możesz oczywiście poprawić wartości):
lub
Drugi jest preferowany, ponieważ nie jest ograniczony do konkretnych wartości. W przypadku nieinformacyjnych priorów nie ponosisz ryzyka. Możesz oczywiście ograniczyć je do określonego przedziału czasowego, ale bądź ostrożny.
Podaj więc nieinformacyjną wcześniej, a rozkład parametrów wyjdzie sam! Nie trzeba zakładać żadnych założeń.
źródło
dnorm(0, 1/10^10)
lub cokolwiekNiestety nieszkodliwe pozorne priory mogą być bardzo niebezpieczne (a nawet oszukały niektórych wytrawnych Bayesian).
Ten ostatni artykuł stanowi miłe wprowadzenie wraz z metodami kreślenia w celu wizualizacji wcześniejszego i tylnego (zwykle marginalne priory / posterior dla parametru (ów)).
Ukryte niebezpieczeństwa związane z określeniem nieinformacyjnych duchownych. John W. Seaman III, John W. Seaman Jr. i James D. Stamey The American Statistician Volume 66, Issue 2, May 2012, strony 77-84. http://amstat.tandfonline.com/doi/full/10.1080/00031305.2012.695938
Moim zdaniem takie wykresy powinny być obowiązkowe w każdej rzeczywistej analizie bayesowskiej, nawet jeśli analityk ich nie potrzebuje - to, co dzieje się w analizie bayesowskiej, powinno być jasne dla większości czytelników.
źródło
Analiza wrażliwości jest zwykle dobrym rozwiązaniem: wypróbuj różne priorytety i zobacz, jak zmienią się Twoje wyniki. Jeśli są solidne, prawdopodobnie będziesz w stanie przekonać wiele osób o swoich wynikach. W przeciwnym razie prawdopodobnie będziesz chciał jakoś określić ilościowo, w jaki sposób priory zmieniają wyniki.
źródło