Po kilku krokach aktualizacji bayesowskiej pozostaję z tylnym rozkładem postaci mieszaniny rozkładów normalnych,Oznacza to, że parametr \ theta jest pobierany z rozkładu, którego plik PDF jest podany jako ważona mieszanina normalnych plików PDF i nie jest sumą normalnych wartości RV. Chciałbym narysować próbki \ theta \ sim \ Pr (\ theta | \ text {data}), aby wykorzystać je w przybliżeniu próbkowania tego tylnego. W praktyce suma nad i może mieć dużą liczbę terminów, więc wybranie terminu i według wag \ {w_i \} może być niepraktyczne, a następnie narysowanie \ theta \ sim N (\ mu_i, \ sigma ^ 2)
. Czy istnieje skuteczny sposób pobierania próbek z tylnej części tego formularza?
monte-carlo
probability
Chris Granade
źródło
źródło
Odpowiedzi:
Zasadniczo można wstępnie wybrać liczbę próbek do pobrania z każdej pod-dystrybucji, a następnie odwiedzić każdą pod-dystrybucję tylko raz i narysować niż liczbę punktów.
To jest
Znajdź zestaw losowy taki, że i uwzględniając wagi.n = ∑ k i = 1 n i<n1,n2,…,nk> n=∑ki=1ni
Wierzę, że robisz to,wi∗n n
rysując rozkład Poissona rozkładwielomianowy (patrz komentarze) średniej dla każdego pod-rozkładu, a następnie normalizując sumę do .NPraca tutaj toO(k)∗O(n)
Więc zrób
Praca tutaj toO(n)
Chociaż oznacza to, że nie otrzymujesz kolejności losowej. Jeśli wymagane jest losowe zamówienie, musisz potasować losowania (także duże ).O(n)
Wygląda na to pierwszym krokiem jest dominują w czasie wykonywania i tej samej kolejności co algorytmu naiwnego, ale jeśli jesteś pewien, że wszystko można zbliżenie Poissona z rozkładów normalnych i przyspieszenia pierwszego kroku.wi∗n≫1
źródło
Uwaga: Oryginalna wersja tego pytania dotyczyła „ważonej sumy rozkładów normalnych”, na którą może być przydatna następująca odpowiedź. Jednak po dłuższej dyskusji na temat tej odpowiedzi, odpowiedzi @Geoff i samego pytania stało się jasne, że tak naprawdę chodziło o próbkowanie „mieszanki normalnych rozkładów”, na które ta odpowiedź nie ma zastosowania.
Suma rozkładów normalnych jest rozkładem normalnym, więc można obliczyć parametry tego pojedynczego rozkładu, a następnie po prostu wyciągnąć z niego próbki. Jeśli nazwiemy ten rozkład , to:N.( μa U m, σ2)a U m)
źródło
Aktualizacja : Ta odpowiedź jest niepoprawna, wynikająca z nieporozumień w terminologii (szczegółowe informacje zawiera poniższy łańcuch komentarzy); Pozostawiam to tylko jako drogowskaz, aby ludzie nie pisali ponownie tej odpowiedzi (oprócz Barrona). Nie głosuj w górę ani w dół.
Zatem łącząc te dwa wyniki
W takim przypadku musisz pobrać próbki tylko z jednej dystrybucji, co powinno być znacznie łatwiejsze w obsłudze.
źródło