Przybliżenie dla rozkładu dyskretnego

11

Jaki jest najlepszy sposób przybliżenia dla dwóch podanych liczb całkowitych gdy znasz średnią , wariancję , skośność i nadmiar kurtozy rozkładu dyskretnego , i z (niezerowych) miar kształtu i wynika, że ​​normalne przybliżenie nie jest właściwe?m , n μ σ 2 γ 1 γ 2 X γ 1 γ 2Pr[nXm]m,nμσ2γ1γ2Xγ1γ2

Zwykle użyłbym normalnego przybliżenia z korekcją liczb całkowitych ...

Pr[(n½)X(m+½)]=Pr[(n½)μσZ(m+½)μσ]=Φ((m+½)μσ)Φ((n½)μσ)

... gdyby skośność i nadmiar kurtozy były (bliżej) 0, ale tutaj tak nie jest.

Muszę wykonać wiele aproksymacji dla różnych dyskretnych dystrybucji z różnymi wartościami i . Chciałbym dowiedzieć się, czy istnieje ustalona procedura, która używa i do wybrania lepszego przybliżenia niż normalne przybliżenie.γ 2 γ 1 γ 2γ1γ2γ1γ2

kjetil b halvorsen
źródło

Odpowiedzi:

4

To interesujące pytanie, które tak naprawdę nie ma dobrego rozwiązania. Istnieje kilka różnych sposobów rozwiązania tego problemu.

  1. Załóżmy podstawową dystrybucję i pasujące momenty - jak sugerują odpowiedzi @ivant i @onestop. Jednym minusem jest to, że uogólnienie wielowymiarowe może być niejasne.

  2. Przybliżenia Saddlepoint. W tym papierze:

    Gillespie, CS i Renshaw, E. Lepsze przybliżenie punktu siodłowego. Mathematical Biosciences , 2007.

    Patrzymy na odzyskanie pliku pdf / pmf, jeśli podano tylko kilka pierwszych chwil. Odkryliśmy, że to podejście działa, gdy skośność nie jest zbyt duża.

  3. Rozszerzenia Laguerre:

    Mustapha, H. i Dimitrakopoulosa, R. Uogólnione rozwinięcia Laguerre o wielowymiarowych gęstościach prawdopodobieństwa z momentami . Komputery i matematyka z aplikacjami , 2010.

    Wyniki w tym artykule wydają się bardziej obiecujące, ale ich nie zakodowałem.

csgillespie
źródło
4

Dopasowanie rozkładu do danych z wykorzystaniem pierwszych czterech momentów jest dokładnie tym, dla czego Karl Pearson opracował rodzinę ciągłych rozkładów prawdopodobieństwa Pearson (obecnie maksymalne prawdopodobieństwo jest znacznie bardziej popularne). Powinno być proste dopasowanie do odpowiedniego członka tej rodziny, a następnie użyj tego samego rodzaju korekcji ciągłości, jak podano powyżej dla rozkładu normalnego.

Zakładam, że musisz mieć naprawdę ogromną wielkość próbki? W przeciwnym razie przykładowe oszacowania skośności, a zwłaszcza kurtozy, są często beznadziejnie nieprecyzyjne, a także bardzo wrażliwe na wartości odstające. W każdym razie bardzo polecam spojrzeć na momenty L jako alternatywę, która ma kilka zalet w stosunku do zwykłych momentów, które mogą być korzystne dla dopasowania rozkładów do danych.

jeden przystanek
źródło
2

Możesz spróbować zastosować rozkład normalny skośny i sprawdzić, czy nadmiar kurtozy dla poszczególnych zestawów danych jest wystarczająco zbliżony do nadmiaru kurtozy rozkładu dla danego skosu. Jeśli tak, możesz użyć skośnego rozkładu normalnego cdf, aby oszacować prawdopodobieństwo. Jeśli nie, musisz wymyślić transformację do pdf normalnego / skośnego podobnego do tego używanego dla rozkładu normalnego skośnego, który dałby ci kontrolę zarówno nad skośnością, jak i nad kurtozą.

Ivan Tarasov
źródło