Dokładne pobieranie próbek z niewłaściwych mieszanin

10

Załóżmy, że chcę próbkować z ciągłego rozkładu p(x) . Jeśli mam wyrażenie p w formularzu

p(x)=ja=1zajafaja(x)

zaja0,jazaja=1fajap

  1. Próbkowanie etykiety z prawdopodobieństwemjazaja
  2. PróbkowanieXfaja

Czy można uogólnić tę procedurę, jeśli są czasami negatywne? Podejrzewam, że widziałem to gdzieś - być może w książce, być może w dystrybucji Kołmogorowa - więc z wielką radością przyjmę referencję jako odpowiedź.zaja

Jeśli konkretny przykład zabawki jest pomocny, powiedzmy, że chciałbym spróbować z to wtedy weź z przyczyn technicznych, które nie powinny mieć większego znaczenia, w wielkim schemacie rzeczy.

p(x,y)exp(-x-y-αxy)x,y>0
α(0,2))

Zasadniczo mógłbym rozwinąć to jako następującą sumę:

p(x,y)n=0(-1)nαn(n2))!(n2))!n!(xn/2)mi-x(n2))!)(yn/2)mi-y(n2))!).

-terms wewnątrz suma może wówczas niezależnie pobrano próbki w zmiennych towarzyszących gamma losowy. Moim problemem jest oczywiście to, że współczynniki są „okazjonalnie” ujemne.(x,y)

Edycja 1 : Wyjaśniam, że staram się wygenerować dokładne próbki z , zamiast obliczać oczekiwania pod . Dla zainteresowanych niektóre z tych procedur są wymienione w komentarzach.ppp

Edycja 2 : Znalazłem odniesienie, które zawiera szczególne podejście do tego problemu, w „Niejednolitej losowej generacji zmiennych” Devroye'a . Algorytm pochodzi z „Uwagi na temat pobierania próbek z kombinacji rozkładów” Bignami i de Matteis . Metodą tą jest efektywne związanie gęstości od góry dodatnimi składnikami sumy, a następnie zastosowanie próbkowania odrzucającego na podstawie tej obwiedni. Odpowiada to metodzie opisanej w odpowiedzi @ Xi'an.

πr8
źródło
1
Dlaczego nie można spróbować tylko przy użyciu wartości bezwzględnej , a następnie negując swoje X ~ f í próbkę? Innymi słowy zdefiniuj Z : = i = 1 | I | (zakładając, że jest skończona), a następnie renormalize swoją sumę przez Z . aiXfjaZ:=i=1|aja|Z
Alex R.
2
@AlexR. Jeśli cię rozumiem, jego wersja byłaby praktyczna do obliczania oczekiwań pod , ale nadal nie do pobierania dokładnych próbek z p . Z pewnością jest to odpowiedź na istotny problem, choć nie do końca tego, czego szukam. pp
πr8
4
To zależy od tego, co zamierzasz zrobić z tą próbką. Na przykład w celu obliczenia momentów wydaje się proste uogólnienie pobierania próbek z mieszanin gęstości poprzez dodatkowe oznaczenie dowolnego punktu wybranego ze składnika o ujemnym współczynniku jako punktu „ujemnego” i ważenie jego udziału ujemnie w oszacowaniu momentu. Podobnie możesz zbudować KDE z takimi ujemnymi wagami, pod warunkiem, że zaakceptujesz możliwość, że niektóre jego wartości będą ujemne! (cc @ Xi'an)
whuber
1
Czym byłaby „dokładna” próbka rozkładu? Ponownie, to, czy i jak można wykorzystać mieszaninę o ujemnej wadze, sprowadza się do tego, jak zamierzasz użyć próbki.
whuber
1
To nie odpowiada na twoje pytanie, ale możesz być zainteresowany przeczytaniem o próbkowaniu z prawdopodobieństw dziennika stats.stackexchange.com/a/260248/35989
Tim

Odpowiedzi:

5

Zastanawiałem się nad tym pytaniem, ale nigdy nie znalazłem satysfakcjonującego rozwiązania.

Jedną z możliwych właściwości jest to, że jeśli gęstość zapisuje gdzie g jest gęstością taką, że g ( x ) ω h ( x ) , symulując z gi odrzucając te symulacje z prawdopodobieństwem ω h ( x ) / g ( x ) dostarcza symulacje z f . W obecnym przypadku g jest znormalizowaną wersją dodatnich składników masy g ( x ) = α i > 0 α i

f(x)=g(x)ωh(x)1ωω>0
gg(x)ωh(x)gωh(x)/g(x)fg i ω H jest reszta H ( x ) = Ď α I < 0 α I f I ( x ) / Ď α I < 0 α , że jest to rzeczywiście znajdują się w Biblia symulacyjna Devroye'a,Niejednorodne generowanie zmiennych losowych, Rozdział II.7.4, ale wynika z prostego rozumowania akceptacji-odrzucenia.
g(x)=αi>0αifi(x)/αi>0αi
ωh
h(x)=αi<0αifi(x)/αi<0αi

Pierwszy obliczeniowa wadą tego podejścia jest to, że pomimo symulujące pierwszy składnik wybrany z , sum zarówno g i h musi być wyliczana dla etapu odrzucenia. Jeśli sumy są nieskończone bez wersji zamkniętej, uniemożliwia to implementację metody akceptowania-odrzucania .figh

Druga trudność polega na tym, że ponieważ obie sumy wag są tego samego rzędu współczynnik odrzucenia 1 - ϱ accept = α i < 0 | α i | / i | α i | nie ma górnej granicy. W rzeczywistości, jeśli szereg związany z α i nie jest absolutnie zbieżny, prawdopodobieństwo akceptacji wynosi zero!

αi>0αi=1αi<0αi
1ϱaccept=αi<0|αi|/i|αi|
αi W tej sytuacji nie można zaimplementować tej metody.

W przypadku reprezentacji mieszanki, jeżeli można zapisać jako f ( x ) = i = 1 α i g i ( x ) - ω i h ( x i )f

f(x)=i=1αigi(x)ωih(xi)1ωiωi>0
(gi,hi)gi(x)ωih(xi)>0

f(x)=κh(x){1a1(x)+a2(x)}
ai(x)nhAlternatywna metoda serii Devroye'a

Problem ten został ostatnio rozważony w kontekście debiasingu tendencyjnych estymatorów dla MCMC, jak na przykład w podejściu Glynn-Rhee . I rosyjski estymator ruletki (w związku z problemem fabryki Bernoulli). I bezstronna metodologia MCMC . Ale nie ma ucieczki od kwestii znaku ... Co sprawia, że ​​jego użycie jest trudne przy szacowaniu gęstości jak w metodach pseudo-marginalnych.

Po dalszym przemyśleniu doszedłem do wniosku, że nie ma ogólnej metody na stworzenie rzeczywistej symulacji z tej serii (zamiast mieszanki, która okazuje się myląca), bez narzucania dalszej struktury elementom serii, jak ta w powyższy algorytm z Biblii Devroye . Rzeczywiście, ponieważ większość (?) Gęstości pozwala na ekspansję szeregową powyższego rodzaju, w przeciwnym razie oznaczałoby to istnienie pewnego rodzaju uniwersalnej maszyny symulacyjnej ...

Xi'an
źródło
Dziękuję Ci! Doceniam również dodatkowe referencje.
πr8
1
pp=λsol-μhXsolλgμh{(x,y):μh(x)<y<λg(x)}
1
(x,y)x
1
Myślałem też o samplerze kromki, ale nie jest to „dokładne” w sensie symulacji.
Xi'an
1

Mam szkic pomysłu, który mógłby zadziałać. To nie jest dokładne , ale mam nadzieję, że asymptotycznie dokładne. Aby przekształcić ją w naprawdę rygorystyczną metodę, w której kontrolowane jest przybliżenie, lub coś w tym zakresie można udowodnić, prawdopodobnie potrzeba dużo pracy.

gh

p=λgμh

λμ=1λ1

Np

  • λNg
  • μNh

(λμ)N=NNnN

xvxϵgvλNg(x)ϵμNh(x)ϵNp(x)ϵ. W tym celu należy założyć, że liczba punktów w objętości jest wystarczająco duża.

gh

Uwaga na temat dokładnej metody:

ghghx(λpμq)pqλppλ>1

Benoit Sanchez
źródło
1
Rozważyłem to, ale odrzuciłem to, ponieważ moje początkowe wysiłki w celu wykazania, że ​​może on działać, doprowadziły do ​​przekonania, że ​​będzie to w najlepszym razie przybliżenie i potencjalnie słabe. Tak, asymptotycznie może to działać, ale nie spełni żądania OP dotyczące „dokładnego” próbkowania z dystrybucji.
whuber
Wydajność tej metody jest dokładnie tego samego rzędu, co dokładna metoda akceptowania-odrzucania.
Xi'an
1
solhxsolh
1
sol/(sol+h)solh
@BenoitSanchez Dziękujemy za szczegółową odpowiedź; Szczególnie doceniam komentarze na końcu dotyczące (potencjalnej) niemożności dokładności. W przeszłości spotkałem fabryki Bernoulli i uważałem je za dość trudne; Spróbuję wrócić do tematu i sprawdzić, czy zawiera on jakieś informacje.
πr8