Badam metodę automatycznego sprawdzania metod Monte Carlo w łańcuchu Markowa i chciałbym podać kilka przykładów błędów, które mogą wystąpić podczas konstruowania lub wdrażania takich algorytmów. Punkty bonusowe, jeśli w opublikowanym artykule użyto niewłaściwej metody.
Szczególnie interesują mnie przypadki, w których błąd oznacza, że łańcuch ma niepoprawny rozkład niezmienniczy, chociaż inne rodzaje błędów (np. Łańcuch nie ergodyczny) również byłyby interesujące.
Przykładem takiego błędu może być brak wyprowadzenia wartości, gdy Metropolis-Hastings odrzuci proponowany ruch.
Odpowiedzi:
1. Marginal Prawdopodobieństwo i estymator średniej harmonicznej
Marginalny prawdopodobieństwo jest definiowana jako stałej normalizacji rozkładu a posteriori
Znaczenie tej ilości wynika z roli, jaką odgrywa ona w porównywaniu modeli za pomocą czynników Bayesa .
Zaproponowano kilka metod przybliżania tej ilości. Raftery i in. (2007) proponują estymator średniej harmonicznej , który szybko stał się popularny ze względu na swoją prostotę. Pomysł polega na wykorzystaniu relacji
W związku z tym, jeśli mamy próbki z tylnej, powiedzmy , ilość ta może być aproksymowane( θ1, . . . , θN.)
To przybliżenie jest powiązane z koncepcją próbkowania ważności .
Zgodnie z prawem wielkich liczb, jak omówiono na blogu Neala , mamy, że ten estymator jest spójny . Problem polega na tym, że wymagana dla dobrego przybliżenia może być ogromna. Zobacz kilka przykładów na blogu Neala lub blogu Roberta 1 , 2 , 3 , 4 .N.
Alternatywy
Istnieje wiele alternatyw dla przybliżenia . Chopin i Robert (2008) przedstawiają niektóre metody oparte na próbkowaniu.p ( x )
2. Nie działa wystarczająco długo sampler MCMC (szczególnie w przypadku multimodalności)
Mendoza i Gutierrez-Peña (1999) wydedukowali referencję przed / za dla stosunku dwóch normalnych średnich i przedstawiają przykład wnioskowania uzyskanego z tym modelem przy użyciu prawdziwego zestawu danych. Stosując metody MCMC, uzyskują próbkę o wielkości tylnej proporcji średnich φ, co pokazano poniżej2000 φ
3. Niektóre inne kwestie, takie jak ocena zbieżności, wybór wartości początkowych, złe zachowanie łańcucha, można znaleźć w tej dyskusji Gelman, Carlin i Neal.
4. Ważność próbkowania
źródło
Darren Wilkinson na swoim blogu podaje szczegółowy przykład częstego błędu w przypadkowym spacerze Metropolis-Hastings. Polecam przeczytanie go w całości, ale tutaj jest wersja tl; dr.
Jeśli rozkład docelowy jest dodatni (jak rozkłady gamma itp. ) W jednym wymiarze, kuszące jest odrzucenie propozycji, które mają ujemną wartość w tym wymiarze. Błędem jest odrzucenie propozycji, które nigdy się nie wydarzyły, i ocena stosunku akceptacji Metropolis-Hastings (MH) tylko dla innych. Jest to błąd, ponieważ sprowadza się do użycia niesymetrycznej gęstości propozycji.
Autor sugeruje zastosowanie jednej z dwóch poprawek.
Policz „negatywy” jako brak akceptacji (i stracić trochę wydajności).
W takim przypadku użyj właściwego współczynnika MH
źródło
Bardzo wyraźny przypadek (związany z przybliżeniem marginalnego prawdopodobieństwa wspomnianym w pierwszej odpowiedzi), w którym prawdziwa zbieżność jest przykładem problemu zmiany etykiety w modelach mieszanin w połączeniu z estymatorem Chiba (1995) . Jak wskazał Radford Neal (1999), jeśli łańcuch MCMC nie zbiega się prawidłowo, w tym sensie, że bada niektóre tryby rozkładu celu, przybliżenie Chib w Monte Carlo nie osiąga właściwej wartości liczbowej.
źródło