Czy mogę zmienić rozkład propozycji w MH MCMC z losowym przejściem bez wpływu na Markovianity?

14

Losowy spacer Metropolis-Hasitings z symetryczną propozycją

q(x|y)=g(|yx|) ma tę właściwość, że prawdopodobieństwo przyjęcia

P(accept y)=min{1,f(y)/f(x)}

nie zależy od propozycji .g()

Czy to oznacza, że ​​mogę zmienić g() w zależności od poprzedniego działania łańcucha, bez wpływu na markovianity łańcucha?

Szczególnie interesujące jest dla mnie dostosowanie skalowania propozycji Normalnej jako funkcji wskaźnika akceptacji.

Byłby również bardzo wdzięczny, gdyby ktoś mógł wskazać algorytmy adaptacyjne stosowane w praktyce dla tego rodzaju problemu.

Wielkie dzięki.

[edytuj: Na podstawie referencji podanych przez robertsy i wok znalazłem następujące referencje na temat algorytmów adaptacyjnych MH:

Andrieu, Christophe i Éric Moulines. 2006.
O właściwościach ergodyczności niektórych adaptacyjnych algorytmów MCMC. The Annals of Applied Probability 16, no. 3: 1462–1505. http://www.jstor.org/stable/25442804 .

Andrieu, Christophe i Johannes Thoms.
2008. Samouczek na temat adaptacyjnego MCMC. Statystyka i informatyka 18, no. 4 (12): 343–373. doi: 10.1007 / s11222-008-9110-y. http://www.springerlink.com/content/979087678366r78v/ .

Atchadé, Y., G. Fort, E. Moulines i P. Priouret. 2009.
Adaptacyjny łańcuch Markowa Monte Carlo: teoria i metody. Przedruk

Atchadé, Yves. 2010.
Ograniczenia twierdzeń dla niektórych adaptacyjnych algorytmów MCMC z jądrem subgeometrycznym. Bernoulli 16, no. 1 (luty): 116-154. doi: 10.3150 / 09-BEJ199. http://projecteuclid.org/DPubS?verb=Display&version=1.0&service=UI&handle=euclid.bj/1265984706&page=record .

Cappé, O., S. J Godsill i E. Moulines. 2007.
Przegląd istniejących metod i najnowszych osiągnięć w sekwencyjnym Monte Carlo. Postępowanie IEEE 95, nr. 5: 899–924.

Giordani, Paolo. 2010.
Adaptacyjna niezależna metropolia – Hastings poprzez szybkie oszacowanie mieszanin normalnych. Journal of Computational and Graphical Statistics 19, no. 2 (6): 243–259. doi: 10.1198 / jcgs.2009.07174. http://pubs.amstat.org/doi/abs/10.1198/jcgs.2009.07174 .

Łatuszyński, Krzysztof, Gareth O Roberts i Jeffrey S. Rosenthal. 2011.
Adaptacyjne próbniki Gibbsa i powiązane metody MCMC. 1101.5838 (30 stycznia). http://arxiv.org/abs/1101.5838 .

Pasarica, C. i A. Gelman. 2009.
Adaptacyjne skalowanie algorytmu Metropolis przy użyciu oczekiwanej kwadratowej odległości skoku. Statistica Sinica.

Roberts, Gareth O. 2009.
Przykłady Adaptive MCMC. Journal of Computational and Graphical Statistics 18, no. 2 (6): 349–367. doi: 10.1198 / jcgs.2009.06134. http://pubs.amstat.org/doi/abs/10.1198/jcgs.2009.06134 .

]

VitoshKa
źródło
Dlaczego nie masz +100 premii ze swojego rekordu SO?
@mbq, prawdopodobnie dlatego, że utworzyłem to konto dawno temu, kiedy miałem 0 lat w systemie operacyjnym ... szkoda, 100 na CW wygląda na wielką sprawę, ponieważ musisz być prawdziwym facetem, aby odpowiedzieć tutaj :)
VitoshKa
Możesz otrzymać bonus, usuwając wszystkie powiązania, a następnie ponownie łącząc konta.
Wok

Odpowiedzi:

7

Myślę, że ten artykuł Heikki Haario i in. da ci odpowiedź, której potrzebujesz. Na znaczność łańcucha wpływa dostosowanie gęstości propozycji, ponieważ wówczas nowa proponowana wartość zależy nie tylko od poprzedniej, ale od całego łańcucha. Ale wydaje się, że sekwencja ma nadal dobre właściwości, jeśli zachowa się wielką ostrożność.

robertsy
źródło
dzięki robertsy, za dobre referencje. w rzeczywistości proces ten nie jest markov. Nawet jeśli prawdopodobieństwo akceptacji jest niezależne od przeszłości, jądro przejścia procesu jest funkcją gęstości propozycji, a zatem zależy od całego łańcucha.
VitoshKa
3

Możesz poprawić wskaźnik akceptacji za pomocą opóźnionego odrzucenia, jak opisano w Tierney, Mira (1999) . Opiera się na drugiej funkcji propozycji i drugim prawdopodobieństwie akceptacji , co gwarantuje, że łańcuch Markowa jest nadal odwracalny z tym samym niezmiennym rozkładem: musisz być ostrożny, ponieważ „ łatwo jest zbudować metody adaptacyjne, które mogą wydawać się skuteczne, ale w rzeczywistości próbka z niewłaściwej dystrybucji ".

Wok
źródło
3

Podejścia sugerowane przez użytkowników wok i robertsy obejmują najczęściej cytowane przykłady tego, czego szukasz, o czym wiem. Aby rozwinąć te odpowiedzi, Haario i Mira napisali w 2006 r. Artykuł, który łączy te dwa podejścia, które nazywają DRAM (adaptacyjna metropolia opóźnionego odrzucenia) .

Andrieu ma dobre podejście do różnych różnych podejść adaptacyjnych MCMC (pdf), które obejmuje Haario 2001, ale także omawia różne alternatywy, które zostały zaproponowane w ostatnich latach.

redmoskito
źródło
1

To jest trochę bezwstydna wtyczka mojej publikacji, ale robimy to dokładnie w tej pracy ( arxiv ). Między innymi proponujemy dostosowanie wariancji rozkładu wykładniczego w celu poprawy akceptacji (krok S3.2 w algorytmie w artykule).

f1

Nie wykorzystujemy informacji o szybkości akceptacji, ale uzyskujemy akceptację niezależnie od interesującej nas ilości (równoważnej energii układu wirowania, prawy dolny ryc. 4).

Jorge Leitao
źródło