Ważona suma dwóch niezależnych zmiennych losowych Poissona

10

Korzystając z wikipedii znalazłem sposób na obliczenie funkcji masy prawdopodobieństwa wynikającej z sumy dwóch zmiennych losowych Poissona. Myślę jednak, że moje podejście jest błędne.

Niech będą dwiema niezależnymi losowymi zmiennymi Poissona ze średnimi i , gdzie i są stałymi, to funkcję generującą prawdopodobieństwo podaje Teraz, korzystając z faktu, że funkcją generującą prawdopodobieństwo dla losowej zmiennej Poissona jest , możemy napisać funkcję generującą prawdopodobieństwo suma dwóch niezależnych zmiennych losowych Poissona jako X1,X2λ1,λ2S2=a1X1+a2X2a1a2S2

GS2(z)=E(zS2)=E(za1X1+a2X2)GX1(za1)GX2(za2).
GXi(z)=eλi(z1)
GS2(z)=eλ1(za11)eλ2(za21)=eλ1(za11)+λ2(za21).
Wygląda na to, że funkcja masy prawdopodobieństwa jest odzyskiwana poprzez pobranie pochodnych nazwa , Gdzie .G S 2 ( z ) Pr (S2GS2(z) solPr(S2=k)=GS2(k)(0)k!GS2(k)=dkGS2(z)dzk

Czy to jest poprawne? Mam wrażenie, że nie mogę po prostu pobrać pochodnej w celu uzyskania funkcji masy prawdopodobieństwa, ze względu na stałe a1 i a2 . Czy to jest poprawne? Czy istnieje alternatywne podejście?

Jeśli jest to poprawne, czy mogę teraz uzyskać przybliżenie rozkładu skumulowanego poprzez obcięcie nieskończonej sumy dla całego k?

Michel
źródło
1
Dlaczego skalujesz sumy za pomocą i ? Suma jest tylko kolejnym rozkładem Poissona bez tego. Zmienne przyjmują wartości w dodatnich liczbach całkowitych, więc coś w rodzaju krotności pierwszego plus razy drugi jest zwykle dość nienaturalne i pozwala odzyskać wartości obu zmiennych. a 2 1 a1a212
Douglas Zare
3
Trudność polega na tym, że jeśli zarówno jak i są liczbami całkowitymi, nie można być pewnym, że przyjmuje tylko wartości całkowite. Dlatego musisz znaleźć nie tylko dla liczb całkowitych ale także dla każdego które można wyrazić jako dla liczb całkowitych nieujemnych i . a 2 S 2 P ( S 2 = k ) k P ( S 2 = α ) α a 1 m + a 2 n m na1a2S2P(S2=k)kP(S2=α)αa1m+a2nmn
Dilip Sarwate,
@DilipSarwate Czy to możliwe? Czy istnieje inne podejście do tego?
Michel,
@DouglasZare Muszę to zrobić ... Może muszę skorzystać z jakiejś metody ładowania.
Michel,
1
Nie sądzę, że możesz zrobić coś lepszego niż podejście z użyciem siły brutalnej, które znajduje możliwe wartości, które może przyjąć, a następnie dla każdego użyjW przypadku większości opcji i spodziewałbym się, że większość sum zmniejszy się do jednego terminu. Oczekuję, że wiesz, że dla , jest losową zmienną Poissona z parametrem . α P { S 2 = α } = a 1 m + a 2 n = α P { X 1 = m } P { X 2 = n } = a 1 m + a 2 n =S2αa1a2a1=a2=1S2λ1+λ2
P{S2=α}=a1m+a2n=αP{X1=m}P{X2=n}=a1m+a2n=αexp(λ1m)λ1mm!exp(λ2n)λ2nn!.
a1a2a1=a2=1S2λ1+λ2
Dilip Sarwate,

Odpowiedzi:

5

Pod warunkiem, że nie jest zbyt duże prawdopodobieństwo koncentracji na jakiejkolwiek pojedynczej wartości w tej liniowej kombinacji, wygląda na to, że rozszerzenie Cornisha-Fishera może zapewnić dobre przybliżenie (odwrotnego) CDF.

Przypomnij sobie, że to rozszerzenie dostosowuje odwrotny CDF standardowego rozkładu normalnego przy użyciu pierwszych kilku kumulantów . Jego skośność jestβ 1S2β1

a13λ1+a23λ2(a12λ1+a22λ2)3

a jego toβ2

a14λ1+3a14λ12+a24λ2+6a12a22λ1λ2+3a24λ22(a12λ1+a22λ2)2.

Aby znaleźć percentyl standardowej wersji , obliczαS2

wα=z+16β1(z21)+124(β23)(z23)z136β12z(2z25z)124(β23)β1(z45z2+2)

gdzie jest percentylem standardowego rozkładu normalnego. Tym samym percentyl wynosizαS2

a1λ1+a2λ2+wαa12λ1+a22λ2.

Eksperymenty numeryczne sugerują, że jest to dobre przybliżenie, gdy zarówno i przekroczą około . Rozważmy na przykład przypadek i (ustawione dla wygody dla uzyskania zerowej średniej):λ1λ25λ1=5, λ2=5π/2, a1=π,a2=2

Postać

Część zacieniowana na niebiesko to CDF obliczony numerycznie, natomiast pod spodem jednolita czerwień to przybliżenie Cornisha-Fishera. Przybliżenie jest zasadniczo płynne z faktycznego rozkładu, pokazując tylko małe systematyczne odjazdy.S2

Whuber
źródło
2
Przyjemne użycie często zapomnianego narzędzia ... i, oczywiście, albo dla albo lub więcej, metoda splotu brutalnej siły nie będzie aż tak bolesna. λ1λ25
jbowman
1

Użyj splotu:

Niech Dla , przeciwnym razie i Dla , przeciwnym razie.fX1(x1)=λx1eλx1!x10fX1(x1)=0fX2(x2)=λx2eλx2!x20fX2(x2)=0

Niech , więc Ten pierwszy jest znany jako splot.Z=X1+X2X1=ZX2

fZ(z)=fx1,x2(zx2,x2)dx1dx2

Jeśli i są niezależne, ten sposób można uzyskać rozkład sumy dwóch ciągłych zmiennych losowych.X1X2

fZ(z)=fX1(zx2)fX2(x2)dx1dx2

Dla dyskretnego rozkładu Który jest również rozkładem Poissona z parametrem

fZ(z)=x2=0zλ1zx2eλ1(zx2)!λ2x2eλ2x2!
=e(λ1+λ2)(λ1+λ2)zz!
λ1+λ2
QAChip
źródło
2
To wydaje się odpowiadać na inne pytanie: mianowicie, jak dodać dwa rozkłady Poissona. Jest to przypadek szczególny (ale bez problemu można go rozszerzyć na przypadki ). Ale co byś zrobił, gdy ? a1=a2=1a1=a2a1a2
whuber
0

Myślę, że rozwiązaniem jest koncepcja złożonego rozkładu Poissona. Idea jest losowa suma z Poissona rozmieszczone i i sekwencją niezależną od . Kiedy ograniczymy się do przypadku, w którym zawsze, wówczas możemy opisać dla liczby rzeczywistej i rozkładu Poissona . Otrzymujesz pgf przez Za sumę otrzymujesz definiować

S=i=1NXi
NXiiidNXi=kkNkN
E[skN]=E[(sk)N]=GN(sk)=exp(λ(sk1))
Z=k1N1+k2N2
GZ(s)=exp(λ1(sk11)+λ2(sk21)).
λ=λ1+λ2 a następnie ostateczna interpretacja jest to, że otrzymany RV związek Poissona intensywnością i dystrybucji które przyjmują wartość z prawdopodobieństwem , a wartość z .
GZ(s)=exp(λ(λ1λ(sk11)+λ2λ(sk11))=exp(λ(λ1λsk1+λ2λsk11)).
λ=λ1+λ2Xik1λ1/λk2λ2/λ

Po udowodnieniu, że rozkłady są złożone Poissona, możemy użyć rekurencji Panjera w przypadku, gdy i są dodatnimi liczbami całkowitymi. Lub możemy łatwo wyprowadzić transformatę Fouriera z postaci pgf i uzyskać rozkład z powrotem przez odwrotność. Zauważ, że masa punktowa wynosi .k1k20

Edytuj po dyskusji:

Myślę, że najlepsze, co możesz zrobić, to MC. Możesz użyć pochodnej, że jest to złożony dystans Poissona.

  1. próbka N z (bardzo wydajny)Pois(λ)
  2. następnie dla każdego próbka, czy pochodzi z czy gdzie prawdopodobieństwo pierwszego to . Zrób to, próbkując rv Bernoulliego z prawdopodobieństwem sukcesu . Jeśli jest to dodaj do próbkowanej sumy, inaczej dodaj .X 1i=1,,NX1X2λ1/λλ1/λ1k1k2

Będziesz miał próbkę powiedzmy 100 000 w kilka sekund.

Alternatywnie możesz osobno próbkować dwa lata w początkowej reprezentacji ... to będzie tak szybkie.

Wszystko inne (FFT) jest skomplikowane, jeśli stały współczynnik k1 i k2 są całkowicie ogólne.

Ric
źródło
1
Ostateczny rozkład można znaleźć za pomocą algorytmu Panjer, jeśli czynniki są liczbami całkowitymi.
Ric
Dzięki! Dotarłem do Jednak , począwszy od tego chciałbym znaleźć sposób na uzyskanie pewnego rodzaju dystrybucji. Wspomniałeś o algorytmie Panjer? Jednak w tym przypadku . @DilipSarwate Wspomniałem, że nie można uprościć następującego ogólnie . GS2(z)=eλ1(za11)eλ2(za21)a1,a2R1a1,a2P{S2=α}=a1m+a2n=αP{X1=m}P{X2=n}=a1m+a2n=αexp(λ1m)λ1mm!exp(λ2n)λ2nn!,a1,a2
Michel,
Cześć Michel, zredagowałem swoją odpowiedź. Tak Panjer ma ograniczone zastosowanie. Ale możesz wypróbować podejście z transformacją Fouriera. Jednak jednostki niecałkowite są problematyczne ... Muszę się zastanowić, co robić w tym przypadku. Tak czy inaczej, należy zauważyć, że wynikiem jest złożony rozkład Poissona (a nie „prosty” rozkład Poissona).
Ric
Cześć Richard, dziękuję za aktualizację! Czy masz na myśli, że powinienem liczbowo spróbować obliczyć: ? Pr(S2=x)=12πReitxGS2(eit)dt
Michel
Coś na drodze ... Gdybyśmy mieli ciągły rozkład, którego możemy obliczyć funkcję charakterystyczną (tak jak Ty), to prowadzi to do szybkiego i przyjemnego wyniku. W naszym przypadku potrzebuję więcej czasu, aby się nad tym zastanowić. Powinno być coś łatwiejszego.
Ric