Jedną naiwną metodą aproksymacji rozkładu normalnego jest dodanie razem może zmiennych losowych IID równomiernie rozmieszczonych na , a następnie recenter i przeskalowanie, w oparciu o centralne twierdzenie graniczne. ( Uwaga dodatkowa : Istnieją dokładniejsze metody, takie jak transformacja Boxa-Mullera ). Suma zmiennych losowych IID jest znana jako rozkład sumy jednolitej lub rozkład Irwina-Halla .
Jak duży jest błąd w przybliżeniu jednolitego rozkładu sumy przez rozkład normalny?
Ilekroć pojawia się ten rodzaj pytania w celu przybliżenia sumy zmiennych losowych IID, ludzie (w tym ja) przywołują twierdzenie Berry'ego-Esseena , które jest skuteczną wersją centralnego twierdzenia granicznego, biorąc pod uwagę, że istnieje trzeci moment:
gdzie jest funkcją rozkładu skumulowanego dla przeskalowanej sumy zmiennych losowych IID, \ rho jest absolutnym trzecim centralnym momentem E | (X-EX) ^ 3 | , \ sigma jest odchyleniem standardowym, a C jest absolutną stałą, którą można przyjąć jako 1, a nawet 1/2 .
To jest niezadowalające. Wydaje mi się, że oszacowanie Berry'ego-Esseena jest najbliższe ostrym rozkładom dwumianowym, które są dyskretne, z największym błędem przy dla symetrycznego rozkładu dwumianowego. Największy błąd występuje przy największym skoku. Jednak rozkład jednolitej sumy nie ma skoków.
Testy numeryczne sugerują, że błąd zmniejsza się szybciej niż .
Przy zastosowaniu 1/2, oszacowanie Berry – Esseena wynosi
który dla około , i , odpowiednio. Rzeczywiste maksymalne różnice dla wydają się wynosić odpowiednio około , i , które są znacznie mniejsze i wydają się spadać jako zamiast .
źródło
Odpowiedzi:
Niech będą iid U ( - b , b ) zmiennych losowych i rozważą znormalizowaną sumę S n =U1,U2,… U(−b,b)
i związana z tym sup norma
δ n = sup x ∈ R | F n ( x ) - Φ ( x ) |
Lemat 1 ( Uspienski ): Następujące związana w ładowni. δ n < 1δn
Dowód . Patrz JV Uspensky (1937), Wprowadzenie do prawdopodobieństwa matematycznego , Nowy Jork: McGraw-Hill, str. 305
Później R. Sherman poprawił to do następujących.
Dowód : patrz R. Sherman, Błąd normalnego przybliżenia do sumy N zmiennych losowych , Biometrika , vol. 58, nr 2, 396–398.
źródło