Czy pełne warunki warunkowe mogą określić rozkład połączeń?

9

Słyszałem, że wszystkie pełne warunki warunkowe (stosowane w próbkowaniu Gibbsa) mogą określać rozkład połączeń. Ale nie rozumiem dlaczego i jak. A może źle usłyszałem? Dzięki!

Tim
źródło

Odpowiedzi:

11

To pozornie proste pytanie jest głębsze niż się wydaje, prowadząc nas aż do twierdzenia Hammersley-Clifford. Fakt, że możemy odzyskać rozkład połączeń z pełnych warunków warunkowych, sprawia, że ​​sampler Gibbs jest możliwy. Może to być postrzegane jako zaskakujący wynik, jeśli pamiętamy, że marginesy nie determinują wspólnego rozkładu.

Zobaczmy, co się stanie, jeśli dokonamy formalnego obliczenia przy użyciu dobrze znanych definicji gęstości złącza, warunków warunkowych i marginesów. Od

fX,Y(x,y)=fXY(xy)fY(y)=fYX(yx)fX(x),
mamy
fYX(yx)fXY(xy)dy=fY(y)fX(x)dy=1fX(x),
i możemy formalnie odzyskać gęstość spoiny po pełnym wykonaniu warunków
fX,Y(x,y)=fYX(yx)fYX(yx)/fXY(xy)dy.()

Problem z tym formalnym obliczeniem polega na tym, że zakłada on, że wszystkie zaangażowane obiekty istnieją.

Na przykład zastanów się, co się stanie, jeśli otrzymamy to

XY=yExp(y)andYX=xExp(x).
Wynika, że fYX(yx)/fXY(xy)=x/yoraz całka w mianowniku () rozbieżne.

Aby zagwarantować, że możemy odzyskać gęstość stawów z pełnych warunków warunkowych za pomocą () potrzebujemy warunków zgodności omówionych w tym dokumencie:

„Compatible Conditional Distribution”, Barry C. Arnold i S. James Press, Journal of American Statistics Association, t. 84, nr 405 (1989), s. 152–156.

Na koniec przeczytaj dyskusję na temat twierdzenia Hammersleya-Clifforda w książce Roberta i Caselli

Zen
źródło
1
Czy możesz wyjaśnić, co należy rozumieć przez „całka… istnieje”? Wydaje się, że są tutaj dwie różne kwestie, mianowicie. (i) robi całkę
fYX(yx)fXY(xy)dy
istnieje czy nie? oraz (ii) jeżeli całka istnieje, to jej wartość1fX(x)? Czy mówisz to za każdym razemX i Y mają gęstości warunkowe, takie jak
fYX(yx)fXY(xy)dy
istnieje, więc musi być tak, że wartość całki wynosi 1fX(x)?
Dilip Sarwate
Dzięki, @Zen! fY i fX|Y można ustalić fX,Y, i fY|X i fX|Y może również ustalić fX,Y. (1) Który zawiera więcej informacji,fY lub fY|X? (2) Który zapewnia mniej zbędnych / pokrywających się informacji fX|Y, fY lub fY|X? (3) ZfY i fY|X, czy jedno z nich już udostępnia informacje drugiego (co wątpię, ponieważ oznaczałoby to, że jedno prowadzi do drugiego)? Wydaje mi się, że jest to „skrzyżowanie” informacji fY i fY|X, który wraz z fX|Y określa fX,Y.
Tim
Cześć @Tim. fY reprezentuje twoją niepewność Y, podczas fYX reprezentuje twoją niepewność Y, biorąc pod uwagę, że znasz wartość X. „Który zawiera więcej informacji?” to nie jest łatwe pytanie. GdybyfXY i fYX są kompatybilne (w znaczeniu Arnolda i Press), a następnie określają fX,Y przez ().
Zen.
Obecnie mam problem z tym samym problemem. Jestem trochę zdezorientowany potrzebą kompatybilnych dystrybucji warunkowych, ponieważ nigdy nie są one wspomniane w żadnym (przynajmniej tym, które przeczytałem) wprowadzeniu do Gibbs Sampling. Czy też potrzeba kompatybilnych dystrybucji warunkowych obowiązuje tylko wtedy, gdy ktoś próbuje formalnie odzyskać wspólne rozkłady, np. Przez (*). -> nie zbliżasz się do rozkładu wspólnego za pomocą Gibbs Sampling?
sklingel
W zwykłym ustawieniu próbkowania Gibbsa stosowanym do problemu statystycznego zakłada się, że istnieje rozkład prawdopodobieństwa stawu (tylny), a zatem pełne warunki warunkowe pochodzące z tego rozkładu stawu są kompatybilne. Poza tym przypadkiem próbkowanie Gibbsa jest bez znaczenia.
Xi'an