Czy można zaufać adaptacyjnej MCMC?

20

Czytam o adaptacyjnej MCMC (patrz np. Rozdział 4 Podręcznika Markov Chain Monte Carlo , red. Brooks i in., 2011; a także Andrieu i Thoms, 2008 ).

Głównym rezultatem Robertsa i Rosenthala (2007) jest to, że jeśli schemat adaptacji spełnia znikający warunek adaptacji (plus pewna inna technika), adaptacyjna MCMC jest ergodyczna w każdym schemacie. Na przykład, znikającą adaptację można łatwo uzyskać, dostosowując operator przejścia w iteracji z prawdopodobieństwem , z .np(n)limnp(n)=0

Ten wynik jest (a posteriori) intuicyjny, asymptotycznie. Ponieważ ilość adaptacji dąży do zera, ostatecznie nie zepsuje ergodyczności. Moje obawy dotyczą tego, co dzieje się z czasem skończonym .

  • Skąd wiemy, że adaptacja nie miesza się z ergodycznością w danym skończonym czasie i że próbnik pobiera próbki z właściwego rozkładu? Jeśli ma to w ogóle sens, ile wypalenia należy zrobić, aby zapewnić, że wczesna adaptacja nie popycha łańcuchów?

  • Czy praktykujący w tej dziedzinie ufają adaptacyjnej MCMC? Powodem, dla którego pytam, jest to, że widziałem wiele najnowszych metod, które próbują wbudować adaptację na inne, bardziej złożone sposoby, które są znane z poszanowania ergodyczności, takie jak metody regeneracji lub zespoły (tj. Uzasadnione jest wybranie przejścia operator, który zależy od stanu innych łańcuchów równoległych). Alternatywnie adaptacja jest wykonywana tylko podczas wypalania, na przykład w Stan , ale nie w czasie wykonywania. Wszystkie te wysiłki sugerują mi, że adaptacyjne MCMC według Robertsa i Rosenthala (które byłoby niezwykle łatwe do wdrożenia) nie jest uważane za niezawodne; ale być może istnieją inne powody.

  • Co z konkretnymi implementacjami, takimi jak adaptacyjna Metropolis-Hastings ( Haario i in. 2001 )?


Bibliografia

Lacerbi
źródło
1
+1, ale czy istnieją gwarancje w określonym czasie, nawet dla niedostosowujących się MCMC?
Juho Kokkala,
2
@JhohoKokkala: prawdopodobnie nie, ale wydaje się, że dzięki adaptacyjnej MCMC dodaje się kolejną warstwę możliwych trybów awarii, które są mniej zrozumiałe i trudniejsze do sprawdzenia niż standardowe problemy konwergencji (które już są dość trudne do zdiagnozowania per se). Przynajmniej takie jest moje rozumienie, dlaczego praktykujący (ja, na przykład) byłby ostrożny.
lacerbi,
1
Myślę, że adaptacja podczas spalania jest najlepszym sposobem radzenia sobie z adaptacją. Oczywiście, jeśli masz pewne obszary tylnej części ciała, które wymagają innego strojenia niż inne, będziesz mieć problemy, ale w takim przypadku, jeśli uruchomisz w pełni adaptacyjne MCMC, nie będziesz mógł zbyt wiele dostosować ze względu na znikający stan. ,
sega_sai,

Odpowiedzi:

2

Skąd wiemy, że adaptacja nie miesza się z ergodycznością w danym skończonym czasie i że próbnik pobiera próbki z właściwego rozkładu? Jeśli ma to w ogóle sens, ile wypalenia należy zrobić, aby zapewnić, że wczesna adaptacja nie popycha łańcuchów?

Ergodyczność i stronniczość dotyczą asymptotycznych właściwości łańcucha Markowa, nie mówią nic o zachowaniu i rozmieszczeniu łańcucha Markowa at a given finite time. Adaptacyjność nie ma nic wspólnego z tym problemem, każdy algorytm MCMC może tworzyć symulacje daleko od celu at a given finite time.

Xi'an
źródło
1
(+1) Dzięki za wyjaśnienie. Tak, rozumiem, że algorytmy MCMC nie mają żadnych gwarancji at a given finite time. Jednak w praktyce używamy ich tak, jakby zapewniały dobre / rozsądne przybliżenie rozkładu docelowego w danym skończonym czasie, mimo że w większości przypadków nie ma teoretycznych gwarancji (AFAIK tylko kilka przypadków jest rozumianych matematycznie). Może powinienem powiedzieć „mieszać się z czasem miksowania ”? To bliższe temu, co miałem na myśli. Jeśli masz sugestie, jak naprawić język, daj mi znać.
lacerbi