Załóżmy, że chcę próbkować z ciągłego rozkładu . Jeśli mam wyrażenie w formularzu
- Próbkowanie etykiety z prawdopodobieństwem
- Próbkowanie
Czy można uogólnić tę procedurę, jeśli są czasami negatywne? Podejrzewam, że widziałem to gdzieś - być może w książce, być może w dystrybucji Kołmogorowa - więc z wielką radością przyjmę referencję jako odpowiedź.
Jeśli konkretny przykład zabawki jest pomocny, powiedzmy, że chciałbym spróbować z to wtedy weź z przyczyn technicznych, które nie powinny mieć większego znaczenia, w wielkim schemacie rzeczy.
Zasadniczo mógłbym rozwinąć to jako następującą sumę:
-terms wewnątrz suma może wówczas niezależnie pobrano próbki w zmiennych towarzyszących gamma losowy. Moim problemem jest oczywiście to, że współczynniki są „okazjonalnie” ujemne.
Edycja 1 : Wyjaśniam, że staram się wygenerować dokładne próbki z , zamiast obliczać oczekiwania pod . Dla zainteresowanych niektóre z tych procedur są wymienione w komentarzach.p
Edycja 2 : Znalazłem odniesienie, które zawiera szczególne podejście do tego problemu, w „Niejednolitej losowej generacji zmiennych” Devroye'a . Algorytm pochodzi z „Uwagi na temat pobierania próbek z kombinacji rozkładów” Bignami i de Matteis . Metodą tą jest efektywne związanie gęstości od góry dodatnimi składnikami sumy, a następnie zastosowanie próbkowania odrzucającego na podstawie tej obwiedni. Odpowiada to metodzie opisanej w odpowiedzi @ Xi'an.
Odpowiedzi:
Zastanawiałem się nad tym pytaniem, ale nigdy nie znalazłem satysfakcjonującego rozwiązania.
Jedną z możliwych właściwości jest to, że jeśli gęstość zapisuje gdzie g jest gęstością taką, że g ( x ) ≥ ω h ( x ) , symulując z gi odrzucając te symulacje z prawdopodobieństwem ω h ( x ) / g ( x ) dostarcza symulacje z f . W obecnym przypadku g jest znormalizowaną wersją dodatnich składników masy g ( x ) = ∑ α i > 0 α i
Pierwszy obliczeniowa wadą tego podejścia jest to, że pomimo symulujące pierwszy składnik wybrany z , sum zarówno g i h musi być wyliczana dla etapu odrzucenia. Jeśli sumy są nieskończone bez wersji zamkniętej, uniemożliwia to implementację metody akceptowania-odrzucania .fi g h
Druga trudność polega na tym, że ponieważ obie sumy wag są tego samego rzędu współczynnik odrzucenia 1 - ϱ accept = ∑ α i < 0 | α i | / ∑ i | α i | nie ma górnej granicy. W rzeczywistości, jeśli szereg związany z α i nie jest absolutnie zbieżny, prawdopodobieństwo akceptacji wynosi zero!
W przypadku reprezentacji mieszanki, jeżeli można zapisać jako f ( x ) = ∞ ∑ i = 1 α i g i ( x ) - ω i h ( x i )f
Problem ten został ostatnio rozważony w kontekście debiasingu tendencyjnych estymatorów dla MCMC, jak na przykład w podejściu Glynn-Rhee . I rosyjski estymator ruletki (w związku z problemem fabryki Bernoulli). I bezstronna metodologia MCMC . Ale nie ma ucieczki od kwestii znaku ... Co sprawia, że jego użycie jest trudne przy szacowaniu gęstości jak w metodach pseudo-marginalnych.
źródło
Mam szkic pomysłu, który mógłby zadziałać. To nie jest dokładne , ale mam nadzieję, że asymptotycznie dokładne. Aby przekształcić ją w naprawdę rygorystyczną metodę, w której kontrolowane jest przybliżenie, lub coś w tym zakresie można udowodnić, prawdopodobnie potrzeba dużo pracy.
Uwaga na temat dokładnej metody:
źródło