Płaski, koniugatowy i hiper-priory. Czym oni są?

15

Obecnie czytam o Bayesian Methods in Computation Molecular Evolution autorstwa Yang. W rozdziale 5.2 mówi o priory, a konkretnie nieinformacyjne / płaskie / niejasne / rozproszone, sprzężone i hiper-priory.

Może to wymagać uproszczenia, ale czy ktoś mógłby wyjaśnić po prostu różnicę między tego rodzaju priorytetami i jak to wpływa na wynik analizy / decyzji, które podejmowałbym w trakcie analizy bayesowskiej?

(Nie jestem statystykiem i dopiero zaczynam naukę analiz bayesowskich, więc im bardziej laik, tym lepiej)

bayesian prior rg255
źródło

15

Mówiąc najprościej, przełożony płaski / nieinformacyjny jest stosowany, gdy ktoś ma niewielką / żadną wiedzę na temat danych, a zatem ma najmniejszy wpływ na wyniki analizy (tj. Wnioskowanie z tyłu).

Rozkłady sprzężone to te, których rozkłady wcześniejsze i późniejsze są takie same, a przeor nazywany jest sprzężonym przełożeniem. Jest uprzywilejowany ze względu na jego algebraiczne wygody , szczególnie gdy prawdopodobieństwo ma rozkład w postaci wykładniczej rodziny (Gaussa, Beta itp.). Jest to niezwykle korzystne w przypadku przeprowadzania tylnych symulacji przy użyciu próbkowania Gibbsa.

I wreszcie wyobraź sobie, że wcześniej ustawiona dystrybucja jest ustawiona na parametr w twoim modelu, jednak chcesz dodać kolejny poziom złożoności / niepewności. Narzuciłbyś wtedy wcześniejszą dystrybucję na parametry wspomnianego wcześniej, stąd nazwa hyper -prior.

Myślę, że analiza danych bayesowskich Gelmana to świetny początek dla każdego, kto jest zainteresowany nauką statystyki bayesowskiej :)

plaster miodu
źródło

1

Po drugie, poparcie dla analizy danych bayesowskich.

Sycorax mówi Przywróć Monikę

14

Na najwyższym poziomie możemy myśleć o wszelkiego rodzaju priorytetach jako o określeniu pewnej ilości informacji, które badacz wnosi do analizy poza danymi: przed spojrzeniem na dane, które wartości parametrów są bardziej prawdopodobne?

W ciemnych czasach analizy bayesowskiej, kiedy Bayesianie walczyli z nią z częstymi, było przekonanie, że badacz chciałby wprowadzić do analizy tak mało informacji, jak to możliwe. Było więc wiele badań i argumentów poświęconych zrozumieniu, w jaki sposób przeor może być w ten sposób „nieinformacyjny”. Dzisiaj Gelman sprzeciwia się automatycznemu wyborowi nieinformacyjnych priorów, mówiąc w Bayesian Data Analysisże opis „nieinformacyjny” odzwierciedla jego stosunek do przeora, a nie jakiekolwiek „specjalne” matematyczne cechy przeora. (Co więcej, we wczesnej literaturze pojawiło się pytanie, w jakiej skali przeor nie ma charakteru informacyjnego. Nie sądzę, że jest to szczególnie ważne w przypadku twojego pytania, ale na dobry przykład tego argumentu z częstej perspektywy patrz początek Gary'ego Kinga, Unifying Political Methodology. )

„Płaski” uprzedni oznacza jednolity uprzedni, w którym wszystkie wartości w zakresie są jednakowo prawdopodobne. Ponownie należy argumentować, czy są one naprawdę nieinformacyjne, ponieważ określenie, że wszystkie wartości są jednakowo prawdopodobne, jest w pewien sposób informacją i może być wrażliwe na sposób parametryzacji modelu. Płaskie priory mają długą historię w analizie bayesowskiej, sięgającą Bayesa i Laplace'a.

„Niejasny” uprzedni jest wysoce rozproszony, choć niekoniecznie płaski, i wyraża, że duży zakres wartości jest prawdopodobny, zamiast koncentrować masę prawdopodobieństwa wokół określonego zakresu. Zasadniczo jest to przeor o dużej wariancji (cokolwiek „duża” wariancja oznacza w twoim kontekście).

Sprzężone priory mają wygodną cechę, która pomnożona przez odpowiednie prawdopodobieństwo, daje wyrażenie w formie zamkniętej. Jednym z przykładów jest wcześniejszy beta z prawdopodobieństwem dwumianowym lub wcześniejszy gamma z prawdopodobieństwem poissona. Pomocne tabele znajdują się w Internecie i Wikipedii. Rodzina wykładnicza jest pod tym względem wyjątkowo wygodna.

Sprzężone priory są często „domyślnym” wyborem dla niektórych problemów ze względu na ich dogodne właściwości, ale to niekoniecznie oznacza, że są one „najlepsze”, chyba że wcześniejsza wiedza może być wyrażona za pomocą wcześniejszego sprzężenia. Postępy w obliczeniach oznaczają, że koniugacja nie jest tak cenna jak kiedyś (por. Próbkowanie Gibbsa vs NUTS), dzięki czemu możemy łatwiej wnioskować z niekoniugowanych priorów bez większych problemów.

$N(\mu,\sigma^2)$ $\mu$ $\sigma^2$ $\mu$ $\sigma^2$

Sycorax mówi Przywróć Monikę
źródło

1

Ponadto czasami nie jest jasne, co to są „dane”, a co „wcześniejsze informacje”, na przykład spójrz na moją odpowiedź na stats.stackexchange.com/questions/112451/ ...

kjetil b halvorsen

Płaski, koniugatowy i hiper-priory. Czym oni są?

Odpowiedzi: