Jakie są definicje priory sprzężonych i warunkowych sprzężonych priorów?

12

Jakie są definicje częściowo sprzężonych priorów i warunkowych sprzężonych priorów ? Znalazłem je w analizie danych bayesowskich Gelmana , ale nie mogłem znaleźć ich definicji.

Tim
źródło

Odpowiedzi:

16

Stosując definicję w analizie danych bayesowskich (wydanie 3) , jeśli F jest klasą rozkładów próbkowania p(y|θ) , a P jest klasą wcześniejszych rozkładów dla θ , to klasa P jest sprzężona z F jeśli

p(θ|y)P for all p(|θ)F and p()P.

Jeśli F jest klasą rozkładów próbkowania p(y|θ,ϕ) , a P jest klasą wcześniejszych rozkładów dla θ od ϕ , to klasa P jest sprzężona warunkowa dla F jeżeli

p(θ|y,ϕ)P for all p(|θ,ϕ)F and p(|ϕ)P.

Warunkowo sprzężone priory są wygodne w konstruowaniu samplera Gibbsa, ponieważ pełną warunkową będzie znana rodzina.

Przeszukałem elektroniczną wersję analizy danych bayesowskich (wydanie trzecie) i nie mogłem wcześniej znaleźć odniesienia do półkoniugatu. Domyślam się, że jest to synonim warunkowo koniugatu, ale jeśli podasz odniesienie do jego zastosowania w książce, powinienem być w stanie podać definicję.

jaradniemi
źródło
+1. Jaki jest adres URL trzeciej edycji Bayesian Data Analysis?
Patrick Coulombe
1
Dzięki! Pół-koniugat pojawia się tutaj (wydanie drugie) books.google.com/… . A tak przy okazji, skąd masz e-booka na 3. edycję?
Tim
1
Nie jestem pewien, dlaczego mówi wcześniej semiconjugate, ponieważ przeora jest w pełni sprzężona. To oświadczenie zostało usunięte w 3. edycji. Ebook można kupić tutaj: crcpress.com/product/isbn/9781439840955 .
jaradniemi
@jaradniemi: W linku, który podałem, oprócz p84, zaznaczono, że wcześniejszy semikonjugat nie jest sprzężonym wcześniejszym.
Tim
1
W co każdy z odnoszą się do siebie i nie odnoszą się do tego samego?
p(θ|y,ϕ)P for all p(|θ,ϕ)F and p(|ϕ)P.
Muno
7

Jako przykład chciałbym użyć normalnej zmiennej wielowymiarowej.

Przypomnij, że prawdopodobieństwo jest podane przez

P(y1,y2,...,yn|μ,Σ)=(2π)ND2det(Σ)N2exp(12i=1N(xiμ)TΣ1(xiμ))

Aby znaleźć to prawdopodobieństwo, możemy wybrać

P(μ,Σ)=Normal(μ;μ0,Λ0)InverseWishart(Σ;ν0,S0)

Zapewniam cię, że nie musisz się martwić o ; są to po prostu parametry wcześniejszej dystrybucji.μ0,Λ0,ν0,S0

Ważne jest jednak, aby nie wiązało się to z prawdopodobieństwem. Aby zobaczyć dlaczego, chciałbym zacytować referencję, którą znalazłem w Internecie.

zauważ, że i pojawiają się razem w sposób niefaktoryzowany; dlatego będą one również połączone ze sobą z tyłuμΣ

Odniesieniem jest „Machine Learning: A Probabilistic Perspective” Kevina P. Murphy'ego. Oto link . Cytat można znaleźć w punkcie 4.6 (Wnioskowanie o parametrach MVN) na górze strony 135.

Aby kontynuować wycenę,

Powyższy uprzedni nazywany jest czasami pół-koniugatem lub warunkowo koniugatem , ponieważ oba warunki warunkowe, i , są indywidualnie sprzężone. Aby utworzyć pełny koniugat przed , musimy użyć przeora, w którym i są od siebie zależne. Zastosujemy wspólną dystrybucję formularzap(μ|Σ)p(Σ|μ)μΣ

p(μ,Σ)=p(Σ)p(μ|Σ)

Chodzi o to, że pierwsza wcześniejsza dystrybucja

P(μ,Σ)=Normal(μ;μ0,Λ0)InverseWishart(Σ;ν0,S0)

zakłada, że i są rozdzielne (lub w pewnym sensie niezależne). Niemniej jednak obserwujemy, że w funkcji prawdopodobieństwa i nie mogą być podzielone na czynniki osobno, co oznacza, że ​​nie będzie można ich rozdzielić w późniejszym (Przypomnij, ). To pokazuje, że „nierozdzielalne” tylne i „rozłączne” na początku nie są sprzężone. Z drugiej strony, przepisującΣ μ Σ ( Tylna ) ( Poprzednia ) ( Prawdopodobieństwo )μΣμΣ(Posterior)(Prior)(Likelihood)

p(μ,Σ)=p(Σ)p(μ|Σ)

tak, że i zależą od siebie (poprzez ), uzyskasz koniugat przed, który jest nazwany jako pół-koniugat przed . Mam nadzieję, że to odpowiada na twoje pytanie.Σ p ( μ | Σ )μΣp(μ|Σ)

ps : Innym naprawdę przydatnym odniesieniem, którego użyłem, jest „Pierwszy kurs bayesowskich metod statystycznych” Petera D. Hoffa. Oto link do książki. Odpowiednie treści można znaleźć w rozdziale 7, zaczynając od strony 105, a on ma bardzo dobre wyjaśnienie (i intuicję) na temat rozkładu normalnego pojedynczego wariantu w rozdziale 5, począwszy od strony 67, który zostanie ponownie wzmocniony w rozdziale 7, gdy zajmie się MVN.

Nigdy być
źródło
1

Jeśli jest klasą rozkładów próbkowania , a jest klasą wcześniejszych rozkładów dla , to klasa jest półprzewodnikiem dla jeżeli dla wszystkich i , gdzie i nie należy do klasy .Fp(y|θ,ϕ)θ P F p ( θ | y , ϕ ) P p ( | θ , ϕ ) F p ( θ , ϕ ) = p ( θ ) × p ( ϕ ) p ( θ ) P p ( ϕ ) P.PθPFp(θ|y,ϕ)Pp(|θ,ϕ)Fp(θ,ϕ)=p(θ)×p(ϕ)p(θ)Pp(ϕ)P

nudtlxt
źródło