Poniżej znajduje się fragment wprowadzenia Bolstad do statystyki bayesowskiej .
Dla wszystkich tych ekspertów może to być trywialne, ale nie rozumiem, w jaki sposób autor stwierdza, że nie musimy wykonywać żadnej integracji, aby obliczyć prawdopodobieństwo późniejsze dla pewnej wartości . Rozumiem drugie wyrażenie, którym jest proporcjonalność i skąd pochodzą wszystkie terminy ( prawdopodobieństwo x pierwszeństwo) . Ponadto rozumiem, że nie musimy martwić się o mianownik, ponieważ tylko licznik jest wprost proporcjonalny. Ale przechodząc do trzeciego równania , czy nie zapominamy o mianowniku reguły Bayesa? Gdzie to poszło? A wartość obliczona przez funkcje Gamma, czy to nie jest stała? Czy stałe nie anulują się w twierdzeniu Bayesa?
distributions
bayesian
beta-distribution
conjugate-prior
Jenna Maiz
źródło
źródło
Odpowiedzi:
Chodzi o to, że wiemy, do czego tylny jest proporcjonalny i tak się dzieje, że nie musimy wykonywać całkowania, aby uzyskać (stały) mianownik, ponieważ uznajemy, że rozkład z funkcją gęstości prawdopodobieństwa proporcjonalną do (np. Z tyłu) to rozkład beta. Ponieważ stałą normalizującą dla takiej wersji beta pdf jest , otrzymujemy tylny pdf bez integracji. I tak, stała normalizująca w twierdzeniu Bayesa jest stałą (biorąc pod uwagę zaobserwowane dane i założone wcześniej), podobnie jak stała normalizująca dla gęstości tylnej.Γ ( α + β )xα−1×(1−x)β−1 Γ(α+β)Γ(α)Γ(β)
źródło
Ustawić
Masz ten model: Gęstości, dla których są aw szczególności zauważ, że f(p)=1
Wersja niejawna
Teraz. Rozkład tylny jest proporcjonalny do wcześniejszego pomnożonego przez prawdopodobieństwo . Możemy zignorować stałe (tj. Rzeczy, które nie są ), co daje:f g p
Ma to „kształt” rozkładu beta z parametrami i , i wiemy, jaka powinna być odpowiednia stała normalizująca dla rozkładu beta z tymi parametrami: . Lub, jeśli chodzi o funkcje gamma, Innymi słowy, możemy zrobić coś lepszego niż stosunek proporcjonalny bez dodatkowej pracy nóg i przejść od razu do równości:α+x β+n−x 1/B(α+x,β+n−x)
Można więc wykorzystać wiedzę o strukturze rozkładu beta, aby łatwo odzyskać wyrażenie dla tylnej części ciała, zamiast przechodzić przez niechlujną integrację i tym podobne.
W pewnym sensie dochodzi do pełnego tylnego przez niejawne anulowanie normalizujących stałych rozkładu stawów, co może być mylące.
Wersja jawna
Możesz także rozdrobnić wszystko proceduralnie, co może być jaśniejsze.
To nie jest tak naprawdę dłużej. Zauważ, że możemy wyrazić wspólną dystrybucję jako i rozkład krańcowy as
Możemy więc wyrazić tylną za pomocą twierdzenia Bayesa przez czyli to samo co poprzednio.
źródło
Uwagi ogólne
Aby uczynić odpowiedź udzieloną przez @ Björna nieco bardziej jednoznaczną, a jednocześnie bardziej ogólną, powinniśmy pamiętać, że doszliśmy do twierdzenia Bayesa z
gdzie reprezentuje obserwowane dane i nasz nieznany parametr, o którym chcielibyśmy wnioskować probabilistycznie - w przypadku pytania parametrem jest nieznana częstotliwość . Nie martwmy się na razie, czy mówimy o wektorach czy skalarach, aby uprościć to.X θ π
Marginalizacja w ciągłym przypadku prowadzi do
gdzie wspólny rozkład jest równy jak widzieliśmy powyżej. Jest to stała, ponieważ po „zintegrowaniu” parametru zależy tylko od stałych warunków .p(X,θ) likelihood×prior
Dlatego możemy przeformułować twierdzenie Bayesa jako
i w ten sposób dojść do zwykłej formy proporcjonalności w Bayesa twierdzenia .
Zastosowanie do problemu rękę
Teraz jesteśmy gotowi po prostu podłączyć to, co wiemy, ponieważ w przypadku pytania ma formęlikelihood×prior
gdzie , i gdzie zbiera stałe warunki z prawdopodobieństwa dwumianowego i beta wcześniejszy.a′=a+y b′=b+n−y A=1B(a,b)(ny)
Możemy teraz użyć odpowiedzi udzielonej przez @ Björna, aby stwierdzić, że integruje się ona z funkcją Beta razy zbiór stałych pojęć tak żeB(a′,b′) A
Zauważ, że jakikolwiek stały termin we wspólnej dystrybucji zawsze będzie anulowany, ponieważ pojawi się w nominatorze i mianowniku w tym samym czasie (por. Odpowiedź udzielona przez @jtobin), więc naprawdę nie musimy się tym przejmować.
W ten sposób uznajemy, że nasz rozkład tylny jest w rzeczywistości rozkładem beta, w którym możemy po prostu zaktualizować parametry wcześniejszego i aby dotrzeć do tyłu. Właśnie dlatego dystrybuowana wersja beta nazywana jest koniugatem .a′=a+y b′=b+n−y
źródło