Czy MCMC nie ma pamięci?

18

Próbuję zrozumieć, czym jest łańcuch Markov Monte Carlo (MCMC) ze strony francuskiej Wikipedii. Mówią, że „metody Monte Carlo w łańcuchu Markowa polegają na generowaniu wektora xja tylko z danych wektorowych xja-1 , dlatego jest to proces„ bez pamięci ””

Les méthodes de Monte-Carlo par chaînes de Markov konsekwentnie generator vecteur xja uniquement partir de la donnée du vecteur xja-1 ; c'est donc un processus «sans mémoire»,

Nie rozumiem, dlaczego mówią, że MCMC są „bez pamięci”, o ile wykorzystujemy informacje z danych wektorowych xja-1 do wygenerowania xja .

IggyPass
źródło
3
Ponieważ nie musisz „zapamiętywać” niczego na temat procesu oprócz ostatniego stanu łańcucha. Myślę, że wciąż potrzebujesz pamięci, ale to tylko jedna informacja.
user2974951
nie jest „zapamiętywany”; to wyraźne wejście. xja-1
chepner

Odpowiedzi:

28

Charakterystyczną cechą łańcucha Markowa jest to, że rozkład warunkowy jego wartości bieżącej zależny od wartości przeszłych zależy tylko od poprzedniej wartości . Zatem każdy łańcuch Markowa jest „bez pamięci” w takim stopniu, że tylko poprzednia wartość wpływa na obecne prawdopodobieństwo warunkowe, a wszystkie poprzednie stany są „zapomniane”. (Masz rację, że nie jest całkowicie pozbawiona pamięci - w końcu rozkład warunkowy bieżącej wartości zależy od poprzedniej wartości). Dotyczy to MCMC, a także każdego innego łańcucha Markowa.

Przywróć Monikę
źródło
9
Jeśli zrobisz to krok naprzód, możesz powiedzieć, że warunkowy rozkład jego przyszłych wartości uzależniony od wartości przeszłych i bieżących zależy tylko od wartości bieżącej iw tym sensie pamięć przeszłości nie jest potrzebna, o ile znana jest aktualna pozycja
Henry
Z wyjątkiem tego, że zawsze możesz dostosować przestrzeń stanu do przechowywania dowolnej skończonej ilości informacji o przeszłości. Na przykład Markovian nadal polega na ostatnich dziesięciu stanach, ponieważ można po prostu rozszerzyć przestrzeń stanu, aby uwzględnić te informacje w „poprzednim stanie”.
David Richerby
15

Chociaż mamy poprawną odpowiedź, chciałbym nieco rozwinąć intuicyjną semantykę tego stwierdzenia. Wyobraźmy sobie, że redefiniujemy nasze indeksy, tak aby generować wektor xja+1 z wektora xja . Teraz chwila ja jest postrzegane jako przenośni „teraźniejszości”, i wszystkie wektory pochodzące „wcześniej niż” xja są nieistotne dla obliczenia następnego w przyszłości.

xja-n

xjaxja-n

rumtscho
źródło
5

Ty obudź się. Nie masz pojęcia, skąd jesteś. Rozglądasz się dookoła i decydujesz, co dalej, wyłącznie na podstawie informacji dostępnych w danym momencie. Jest to zasadniczo ta sama sytuacja, co dzieje się w MCMC.

xjaxja-1xja-1xja+1xja

Dason
źródło
2
Nazwijmy to metodą kaca
IggyPass
@Pasażer Nazywaj to, jak chcesz. Po prostu proszę podać aspirynę.
Dason