Czy próbkowanie oparte na łańcuchu Markowa jest „najlepsze” dla próbkowania Monte Carlo? Czy są dostępne alternatywne programy?

10

Łańcuch Markowa Monte Carlo jest metodą opartą na łańcuchach Markowa, która pozwala nam uzyskać próbki (w ustawieniu Monte Carlo) z niestandardowych rozkładów, z których nie możemy bezpośrednio pobierać próbek.

Moje pytanie brzmi: dlaczego sieć Markowa jest „najnowocześniejsza” do próbkowania Monte Carlo. Alternatywnym pytaniem może być: czy istnieją inne sposoby, takie jak łańcuchy Markowa, które można wykorzystać do próbkowania Monte Carlo? Wiem (przynajmniej patrząc na literaturę), że MCMC ma głębokie teoretyczne korzenie (w kategoriach warunków takich jak (a) okresowość, jednorodność i szczegółowa równowaga), ale zastanawiam się, czy istnieją jakieś „porównywalne” modele / metody probabilistyczne dla Monte Pobieranie próbek Carlo podobne do łańcuchów Markowa.

Proszę, prowadź mnie, jeśli pomyliłem jakąś część pytania (lub jeśli wydaje się to całkowicie mylące).

Ikram Ullah
źródło

Odpowiedzi:

11

Nie ma powodu, aby twierdzić, że próbkowanie MCMC jest „najlepszą” metodą Monte Carlo! Zwykle jest gorzej niż próbkowanie iid, przynajmniej pod względem wariancji powstałych estymatorów Monte Carlo

1Tt=1Th(Xt)
Rzeczywiście, podczas gdy ta średnia jest zbieżna z oczekiwaniami Eπ[h(X)] kiedy π to stacjonarna i ograniczająca dystrybucja łańcucha Markowa (Xt)t, istnieją co najmniej dwie wady stosowania metod MCMC:
  1. Łańcuch musi „osiągnąć stacjonarność”, co oznacza, że ​​musi zapomnieć o swojej wartości początkowej X0. Innymi słowy,t musi być „wystarczająco duży” dla Xt do dystrybucji π. Czasami „wystarczająco duży” może przekroczyć o kilka rzędów wielkości budżet obliczeniowy na eksperyment.
  2. Wartości Xt są skorelowane, co prowadzi do asymptotycznej wariancji, która obejmuje
    varπ(X)+2t=1covπ(X0,Xt)
    co ogólnie przekracza varπ(X) i dlatego wymaga dłuższych symulacji niż dla próbki iid.

Biorąc to pod uwagę, MCMC jest bardzo przydatny do obsługi ustawień, w których regularne próbkowanie iid jest niemożliwe lub zbyt kosztowne i gdzie ważność próbkowania jest dość trudna do skalibrowania, w szczególności ze względu na wymiar symulowanej zmiennej losowej.

Jednak sekwencyjne metody Monte Carlo, takie jak filtry cząstek, mogą być bardziej odpowiednie w modelach dynamicznych, w których dane pochodzą z serii, które wymagają natychmiastowej uwagi, a nawet mogą po krótkim czasie zniknąć (tj. Nie mogą być przechowywane).

Podsumowując, MCMC jest bardzo przydatnym (i bardzo często używanym) narzędziem do obsługi złożonych ustawień, w których zawodzą zwykłe rozwiązania Monte Carlo.

Xi'an
źródło
8

Istnieje kilka sposobów generowania losowych wartości z rozkładu, McMC jest jednym z nich, ale kilka innych można również uznać za metody Monte Carlo (bez części łańcucha Markowa).

Najbardziej bezpośrednie w przypadku próbkowania jednowymiarowego jest wygenerowanie jednolitej zmiennej losowej, a następnie podłączenie jej do odwrotnej funkcji CDF. Działa to świetnie, jeśli masz odwrotny CDF, ale jest kłopotliwy, gdy CDF i / lub jego odwrotność są trudne do bezpośredniego obliczenia.

W przypadku problemów wielowymiarowych można wygenerować dane z kopuły, a następnie zastosować odwrotną metodę CDF na wygenerowanych wartościach, aby uzyskać pewien poziom korelacji między zmiennymi (chociaż określenie poprawnych parametrów dla kopuły w celu uzyskania pożądanego poziomu korelacji często wymaga trochę próba i błąd).

Próbkowanie przy odrzuceniu to inne podejście, które można wykorzystać do generowania danych z rozkładu (jedno- lub wielowymiarowego), w którym nie musisz znać CDF lub jego odwrotności (i nie potrzebujesz nawet stałej normalizującej dla funkcji gęstości), ale w niektórych przypadkach może to być bardzo nieefektywne i zajmuje dużo czasu.

Jeśli interesują Cię podsumowania wygenerowanych danych, a nie losowe punkty, próbkowanie według ważności jest kolejną opcją.

Próbkowanie Gibbsa, które jest formą próbkowania McMC, umożliwia próbkowanie tam, gdzie nie znasz dokładnej postaci rozkładu wielowymiarowego, o ile znasz rozkład warunkowy dla każdej zmiennej, biorąc pod uwagę pozostałe.

Są też inne, co najlepiej zależy od tego, co wiesz i czego nie wiesz oraz innych szczegółów konkretnego problemu. McMC jest popularny, ponieważ działa dobrze w wielu sytuacjach i uogólnia na wiele różnych przypadków.

Greg Snow
źródło