Jeśli mam zmienne losowe które są rozkładem Poissona z parametrami , jaki jest rozkład (tj. całkowita liczba średnia)?
Suma Poissonów jest również Poissonem, ale nie jestem wystarczająco pewna w statystykach, aby ustalić, czy jest taka sama w powyższym przypadku.
poisson-distribution
average
Lubo Antonov
źródło
źródło
Odpowiedzi:
Uogólnienie pytania wymaga rozkładu gdy rozkład X jest znany i poparty liczbami naturalnymi. (W pytaniu X ma rozkład Poissona parametru λ = λ 1 + λ 2 + ⋯ + λ n i m = n .)Y=⌊X/m⌋ X X λ=λ1+λ2+⋯+λn m=n
Rozkład jest łatwo określana przez rozkład m Y , którego prawdopodobieństwo generowania funkcji (PGF) można określić w kategoriach PGF o X . Oto zarys pochodnej.Y mY X
Napisz dla pgf X , gdzie (z definicji) p n = Pr ( X = n ) . m Y jest skonstruowane z X w taki sposób, że jego pgf, q , wynosip(x)=p0+p1x+⋯+pnxn+⋯ X pn=Pr(X=n) mY X q
Ponieważ jest to absolutnie zbieżne dla , możemy zmienić warunki na sumę części formularza|x|≤1
dlat=0,1,…,m−1 . Seria zasilające funkcji składa się z co m th okres serii P , wychodząc z t p : jest czasami nazywany decymacji w p . Wyszukiwania Google obecnie nie wyświetlają użytecznych informacji o dziesiętnych, więc dla kompletności, oto pochodna wzoru.xtDm,tp mth p tth p
Niech być dowolny prymitywny m th korzeni jedności; na przykład weź ω = exp ( 2 i π / m )ω mth ω=exp(2iπ/m) . Następnie wynika z i ∑ m - 1 j = 0 ω j = 0 toωm=1 ∑m - 1j = 0ωjot= 0
Aby to zobaczyć, zauważ, że operator jest liniowy, więc wystarczy sprawdzić formułę na podstawie { 1 , x , x 2 , … , x n , … } . Zastosowanie prawej strony do x n dajextrem , t { 1 , x , x2), … , Xn, … } xn
Gdy i n różnią się wielokrotnością m , każdy składnik w sumie jest równy 1 i otrzymujemy x n . W przeciwnym razie terminy przechodzą przez potęgi ω t - n i sumują się do zera. Skąd ten operator zachowuje wszystkie moce x przystające do t modulo m i zabija wszystkie pozostałe: jest to dokładnie pożądana projekcja.t n m 1 xn ωt - n x t m
Wzór na następuje łatwo, zmieniając kolejność sumowania i rozpoznając jedną z sum jako geometryczną, zapisując ją w formie zamkniętej:q
Na przykład pgf rozkładu Poissona parametru to p ( x ) = exp ( λ ( x - 1 )λ . Przy m = 2 , ω = - 1 i pgf 2 Y będziep ( x ) = exp( λ ( x - 1 ) ) m = 2 ω = - 1 2 Y
Jednym z zastosowań tej metody jest obliczenie momentów i m Y . Wartość k- tej pochodnej pgf oceniana przy x = 1 jest k- tym momentem czynnikowym. K th chwili jest kombinacją liniową pierwszych k moment silni. Korzystając z tych obserwacji, stwierdzamy na przykład, że dla Poissona rozproszonego X.X mY kth x=1 kth kth k X jego średnia (która jest pierwszym momentem czynnikowym) wynosi , średnia 2 ⌊ ( X / 2 ) ⌋ jest równa λλ 2⌊(X/2)⌋ , a średnia z3⌊(X/3)⌋jest równaλ-1+e-3λ/2(sin ( √λ−12+12e−2λ 3⌊(X/3)⌋ :λ−1+e−3λ/2(sin(3√λ2)3√+cos(3√λ2))
Średnie dla pokazano odpowiednio na niebiesko, czerwono i żółto, jako funkcje λ : asymptotycznie, średnia spada o ( m - 1 ) / 2 w porównaniu z pierwotną średnią Poissona.m=1,2,3 λ (m−1)/2
Podobne wzory dla wariancji można uzyskać. (Stają się niechlujne wraz ze wzrostem więc są pomijane. Jedną rzeczą, którą ostatecznie ustalają, jest to, że gdy m > 1 żadna wielokrotność Y nie jest Poissonem: nie ma ona charakterystycznej równości średniej i wariancji) Oto wykres wariancji jako funkcja λ dla m = 1 , 2 , 3 :m m>1 Y λ m=1,2,3
Interesujące jest to, że dla większych wartości wariancje rosną . Intuicyjnie wynika to z dwóch konkurujących ze sobą zjawisk: funkcja podłogi skutecznie grupuje grupy wartości, które pierwotnie były odrębne; musi to spowodować zmniejszenie wariancji . Jednocześnie, jak widzieliśmy, zmieniają się również środki (ponieważ każdy bin jest reprezentowany przez jego najmniejszą wartość); musi to spowodować dodanie z powrotem terminu równego kwadratowi różnicy średnich środków. Wzrost wariancji dla dużego λ staje się większy przy większych wartościach m .λ λ m
Zachowanie wariancji z m jest zaskakująco złożone. Zakończmy szybką symulacją (in ) pokazującą, co potrafi. Wykresy pokazują różnicę między wariancją m ⌊ X / m ⌋ a wariancją X dla Poissona o rozkładzie X z różnymi wartościami λ w zakresie od 1mY m m⌊X/m⌋ X X λ 1 do . We wszystkich przypadkach wykresy wydają się osiągać wartości asymptotyczne po prawej stronie.5000
R
źródło
sapply()
do symulacji. Dzięki.Jak mówi Michael Chernick, jeśli poszczególne zmienne losowe są niezależne, wówczas suma wynosi Poissona z parametrem (średnia i wariancja)∑ni=1λi które można nazwać .λ
Dzielenie przez zmniejsza średnią do λ / n i wariancji λ / nn λ/n więc wariancja będzie mniejsza niż równoważny rozkład Poissona. Jak mówi Michael, nie wszystkie wartości będą liczbami całkowitymi.λ/n2
Korzystanie z funkcji podłogi nieznacznie zmniejsza średnią i nieco wpływa na wariancję, choć w bardziej skomplikowany sposób. Chociaż masz wartości całkowite, wariancja nadal będzie znacznie mniejsza niż średnia, więc będziesz miał węższy rozkład niż Poisson.12−12n
źródło
Funkcja masy prawdopodobieństwa średniej z niezależnych zmiennych losowych Poissona może być zapisana wprost, chociaż odpowiedź może ci niewiele pomóc. Jak zauważył Michael Chernick w komentarzach do swojej własnej odpowiedzi, suma ∑ i X i niezależnych zmiennych losowych Poissona X i o odpowiednich parametrach λ i jest zmienną losową Poissona z parametrem λ = ∑ i λ i . Zatem P { n ∑ i = 1 X i = k } = expn ∑jaXja Xja λja λ = ∑jaλja
A zatem, Y =n-1Σ n i = 1 Xijest zmienną losową o przyjmowanie wartościk/nz prawdopodobieństwemexp(-X)λK
źródło
Y nie będzie Poissonem. Należy zauważyć, że zmienne losowe Poissona przyjmują nieujemne wartości całkowite. Po podzieleniu przez stałą tworzona jest zmienna losowa, która może mieć wartości inne niż całkowite. Nadal będzie miał kształt Poissona. Po prostu dyskretne prawdopodobieństwa mogą wystąpić w punktach niecałkowitych.
źródło