Przechodziłem wykłady związane z MCMC. Nie znalazłem jednak dobrego przykładu tego, jak się go używa. Czy ktoś może dać mi konkretny przykład. Widzę tylko, że prowadzą łańcuch Markowa i mówią, że jego rozkład stacjonarny jest rozkładem pożądanym.
Chcę dobrego przykładu, w którym trudno jest pobrać żądany rozkład. Tworzymy łańcuch Markowa. Chcę wiedzieć, jak wybrać macierz przejścia, aby jej rozkład stacjonarny łańcucha Markowa był rozkładem docelowym. Dzięki
probability
bayesian
mcmc
markov-process
użytkownik34790
źródło
źródło
Odpowiedzi:
Dobrym przykładem dystrybucji, z której trudno jest próbkować, jest model Hard-Core, zobacz tę stronę, aby uzyskać przegląd:
http://www.mathematik.uni-ulm.de/stochastik/lehre/ss06/markov/skript_engl/node34.html
Ten model definiuje rozkład na siatce dla niektórych stałych , gdzie w każdym punkcie siatki można mieć wartość jeden lub zero. Aby siatka była dopuszczalna w modelu twardym, żaden z dwóch sąsiadujących punktów na siatce nie może mieć wartości 1.n×n n
Poniższy obraz pokazuje przykładową dopuszczalną konfigurację siatki w modelu hard-core. Na tym obrazie są one przedstawione jako czarne kropki, a zera jako białe. Zauważ, że nie dwie czarne kropki sąsiadują ze sobą.8×8
Wierzę, że inspiracja dla tego modelu pochodzi z fizyki, możesz myśleć o każdej pozycji na siatce jako cząstce, a wartość w tej pozycji reprezentuje ładunek elektryczny lub spin.
Chcemy równomiernie próbkować z populacji dopuszczalnych siatek, to znaczy jeśli jest zbiorem dopuszczalnych siatek, chcemy próbkować tak, abyE e∈E
gdzieto liczba wszystkich możliwych dopuszczalnych konfiguracji.|E|
To już stanowi wyzwanie, biorąc pod uwagę, że rozważamy siatek, jak możemy ustalićliczba dopuszczalnych sieci?n×n |E|
Jedną z miłych rzeczy w MCMC jest to, że pozwala na próbkowanie z rozkładów, w których stała normalizująca jest trudna lub niemożliwa do oszacowania.
Pozwolę ci przeczytać artykuł na temat tego, jak wdrożyć MCMC dla tego problemu, ale jest to stosunkowo proste.
źródło
Myślę, że najlepszym przykładem, jaki mogę ci dać, jest:
Przykład Markov Chain Monte Carlo autorstwa Murali Haran
Który zawiera użyteczny kod w R.
Myślę, że mógłbym tutaj odtworzyć ten artykuł, ale nie ma to sensu.
źródło
Kolejny trudny problem w statystykach. Pytanie jest stare, ale trudno znaleźć przykłady wprowadzające w Internecie. Pozwolę sobie zatem uprościć dwa świetne przykłady na wypadek, gdyby ktoś podążający losowym marszem PageRank wylądował tutaj, oszołomiony przez MCMC, i pełen oczekiwania na łatwą do naśladowania odpowiedź. Jak prawdopodobne To może być kolejne pytanie.
Trudność polega na wiedząc, że po przejściu przez wszystkie etapy mechanicznych, istnieje tylko jedna magiczna sztuczka: binarna decyzja o akceptacji lub odrzuceniu z proponowaną wartość .
mean
sd
rnorm(10000)
eps
runif(1, - eps, eps)
Każda proponowana wartość różniłaby się zatem od poprzedniej wartości w sposób losowy i w granicach
[- eps,+ eps]
.min(1, dnorm(candidate_value)/dnorm(x))
min(1, ...)
dnorm
min(1, dnorm(candidate_value)/dnorm(x))
runif(1)
x[i+1]
x[i]
sd
x = 0; vec[1] = x
Jest to bardziej ekscytujące i odnosi się do szacowania parametrów krzywej regresji liniowej poprzez obliczanie prawdopodobieństw logarytmicznych dla parametrów losowych dla danego zestawu danych . Jednak egzegeza linii kodu jest wbudowana w zapisaną tutaj skondensowaną symulację , wykonując bardzo podobne kroki do pierwszego przykładu.
źródło
Ten film na Youtube jest naprawdę fajną wizualizacją prostego problemu, który został rozwiązany za pomocą MCMC.
Rozkład zainteresowania jest rozkładem tylnym na możliwych nachyleniach i przechwytuje w regresji liniowej (prawy górny panel). Niektóre kombinacje nachyleń i punktów przecięcia są bardzo prawdopodobne (tj. Mają wysokie prawdopodobieństwo wygenerowania zaobserwowanych punktów danych i są zgodne z naszymi oczekiwaniami a priori ), dlatego należy je często próbkować. Inne kombinacje są nieprawdopodobne (np. Jeśli odpowiadają niebieskiej linii, która nie przechodzi przez chmurę punktów danych) i należy próbkować rzadziej.
Duży panel w lewym dolnym rogu pokazuje ścieżkę obraną przez łańcuch Markowa przez dwuwymiarową przestrzeń stoków i przecięć. Histogramy pokazują jednowymiarowe podsumowania dotychczasowych postępów łańcucha. Gdy łańcuch będzie działał wystarczająco długo, mamy bardzo dobre oszacowania rozkładów dla możliwych wartości nachylenia i przecięcia.
W tym przypadku MCMC to przesada, ale istnieją pewne problemy, w których rozwiązanie jest trudne do spisania i sensowne jest badanie możliwości za pomocą łańcucha Markowa, zamiast próbowania rozwiązania go bezpośrednio.
źródło