Czytam o adaptacyjnej MCMC (patrz np. Rozdział 4 Podręcznika Markov Chain Monte Carlo , red. Brooks i in., 2011; a także Andrieu i Thoms, 2008 ).
Głównym rezultatem Robertsa i Rosenthala (2007) jest to, że jeśli schemat adaptacji spełnia znikający warunek adaptacji (plus pewna inna technika), adaptacyjna MCMC jest ergodyczna w każdym schemacie. Na przykład, znikającą adaptację można łatwo uzyskać, dostosowując operator przejścia w iteracji z prawdopodobieństwem , z .
Ten wynik jest (a posteriori) intuicyjny, asymptotycznie. Ponieważ ilość adaptacji dąży do zera, ostatecznie nie zepsuje ergodyczności. Moje obawy dotyczą tego, co dzieje się z czasem skończonym .
Skąd wiemy, że adaptacja nie miesza się z ergodycznością w danym skończonym czasie i że próbnik pobiera próbki z właściwego rozkładu? Jeśli ma to w ogóle sens, ile wypalenia należy zrobić, aby zapewnić, że wczesna adaptacja nie popycha łańcuchów?
Czy praktykujący w tej dziedzinie ufają adaptacyjnej MCMC? Powodem, dla którego pytam, jest to, że widziałem wiele najnowszych metod, które próbują wbudować adaptację na inne, bardziej złożone sposoby, które są znane z poszanowania ergodyczności, takie jak metody regeneracji lub zespoły (tj. Uzasadnione jest wybranie przejścia operator, który zależy od stanu innych łańcuchów równoległych). Alternatywnie adaptacja jest wykonywana tylko podczas wypalania, na przykład w Stan , ale nie w czasie wykonywania. Wszystkie te wysiłki sugerują mi, że adaptacyjne MCMC według Robertsa i Rosenthala (które byłoby niezwykle łatwe do wdrożenia) nie jest uważane za niezawodne; ale być może istnieją inne powody.
Co z konkretnymi implementacjami, takimi jak adaptacyjna Metropolis-Hastings ( Haario i in. 2001 )?
Bibliografia
- Rosenthal, JS (2011). Optymalne rozkłady propozycji i adaptacyjne MCMC. Podręcznik Markov Chain Monte Carlo , 93-112.
- Andrieu, C., i Thoms, J. (2008) . Samouczek na temat adaptacyjnej MCMC. Statystyka i informatyka , 18 (4), 343–373.
- Roberts, GO i Rosenthal, JS (2007) . Sprzężenie i ergodyczność adaptacyjnych algorytmów Monte Carlo łańcucha Markowa. Dziennik zastosowanego prawdopodobieństwa , 458–475.
- Haario, H., Saksman, E., i Tamminen, J. (2001) . Adaptacyjny algorytm Metropolis. Bernoulli , 223–242.
Odpowiedzi:
Ergodyczność i stronniczość dotyczą asymptotycznych właściwości łańcucha Markowa, nie mówią nic o zachowaniu i rozmieszczeniu łańcucha Markowa
at a given finite time
. Adaptacyjność nie ma nic wspólnego z tym problemem, każdy algorytm MCMC może tworzyć symulacje daleko od celuat a given finite time
.źródło
at a given finite time
. Jednak w praktyce używamy ich tak, jakby zapewniały dobre / rozsądne przybliżenie rozkładu docelowego w danym skończonym czasie, mimo że w większości przypadków nie ma teoretycznych gwarancji (AFAIK tylko kilka przypadków jest rozumianych matematycznie). Może powinienem powiedzieć „mieszać się z czasem miksowania ”? To bliższe temu, co miałem na myśli. Jeśli masz sugestie, jak naprawić język, daj mi znać.