Centralne twierdzenie graniczne dla pierwiastków kwadratowych sum iid zmiennych losowych

11

Zaintrygowany pytaniem z math.stackexchange i badając go empirycznie, zastanawiam się nad następującym stwierdzeniem o pierwiastku kwadratowym sum iid zmiennych losowych.

Załóżmy że są zmiennymi losowymi o skończonej niezerowej średniej i wariancji , a . Twierdzenie o granicy centralnej mówi gdy wzrasta. μ σ 2 Y = n i = 1 X i Y - n μX1,X2,,Xnμσ2Y=i=1nXinYnμnσ2 d N(0,1)n

Jeśli , czy mogę również powiedzieć coś takiego jak miarę wzrostu ?Z - Z=|Y|nZn|μ|σ24|μ|σ24|μ| d N(0,1)n

Załóżmy na przykład, że są Bernoullim ze średnią i wariancją , wtedy jest dwumianowy i mogę to zasymulować w R, powiedzmy za pomocą : p p ( 1 - p ) YXipp(1p)Yp=13

set.seed(1)
cases <- 100000
n <- 1000
p <- 1/3
Y <- rbinom(cases, size=n, prob=p)
Z <- sqrt(abs(Y))

co daje w przybliżeniu oczekiwaną średnią i wariancję dlaZ

> c(mean(Z), sqrt(n*p - (1-p)/4))
[1] 18.25229 18.25285
> c(var(Z), (1-p)/4)
[1] 0.1680012 0.1666667

oraz wykres QQ, który wygląda jak Gaussa

qqnorm(Z)

wprowadź opis zdjęcia tutaj

Henz
źródło
1
@MichaelM: Dzięki za komentarze. Zacząłem od nieujemnego, ale myślałem, że intuicyjne zachowanie asymptotyczne, które opisujesz, pozwoliło na uogólnienie na więcej dystrybucji. Moimi niespodziankami były (a) wariancja pierwiastka kwadratowego sumy najwyraźniej zmierzająca do stałej niezale nej od oraz (b) pojawienie się rozkładu, który wygląda bardzo blisko Gaussa. Przeciwny przykład byłby mile widziany, ale kiedy próbowałem innych przypadków, które początkowo wydawały się nie Gaussowskie, zwiększenie dalej wydawało się przywrócić rozkład do wyniku typu CLT. Xinnn
Henry
Następstwem tego jest średnia kwadratowa (lub kwadratowa) odpowiednio dobranych zmiennych losowych iid (pomnożona przez jak ze średnią arytmetyczną) również zbiega się do rozkładu Gaussa, pod warunkiem, że moment podstawowa dystrybucja jest skończona. 4n4
Henry
3
Krótki komentarz: twierdzenie jest szczególnym przypadkiem metody Delta, patrz Twierdzenie 5.5.24 w książce „Wnioskowanie statystyczne” Caselli i Bergera.
Michael M
@Michael: Być może widzisz coś, czym w tej chwili nie jestem, ale nie sądzę, aby ten konkretny problem mieścił się w założeniach klasycznej metody Delta (np. Jak stwierdzono w cytowanym przez ciebie twierdzeniu). Zauważ, że nie jest zbieżny w dystrybucji (nietypowo na ), a zatem „zastosowanie metody Delta za pomocą ” nie spełnia wymaganych wymagań. Jednak, jak pokazuje odpowiedź S. Catterall, zapewnia on przydatną heurystykę, która prowadzi do prawidłowej odpowiedzi. R g ( y ) = YRg(y)=|y|
kardynał
(Wierzę, że można dostosować dowód metody Delta do przypadków podobnych do powyższego, aby w pełni uszanować wspomnianą heurystykę.)
kardynał

Odpowiedzi:

14

Konwergencja do Gaussa jest rzeczywiście zjawiskiem ogólnym.

Załóżmy, że są losowymi zmiennymi IID o średniej i wariancji , i zdefiniuj sumy . Napraw liczbę . Zwykłe twierdzenie o centralnym mówi nam, że as , gdzie to standardowy normalny plik cdf. Jednak ciągłość ograniczającego cdf oznacza, że ​​mamy równieżX1,X2,X3,...μ>0σ2Yn=i=1nXiαP(Ynnμσnα)Φ(α)nΦ

P(Ynnμσnα+α2σ24μσn)Φ(α)
ponieważ dodatkowy termin po prawej stronie nierówności dąży do zera. Zmiana tego wyrażenia prowadzi do
P(Yn(ασ2μ+nμ)2)Φ(α)

Biorąc pierwiastki kwadratowe i zauważając, że oznacza, że , otrzymujemy Innymi słowy, . Ten wynik pokazuje konwergencję do gaussowskiego w granicy jako .μ>0P(Yn<0)0

P(|Yn|ασ2μ+nμ)Φ(α)
|Yn|nμσ/2μdN(0,1)n

Czy to oznacza, że jest dobrym przybliżeniem do dla dużego ? Cóż, możemy zrobić lepiej niż to. Jak zauważa @Henry, zakładając, że wszystko jest pozytywne, możemy użyć , razem z i przybliżenie , aby uzyskać ulepszone przybliżenie jak podano w powyższym pytaniu. Zauważ też, że wciąż mamy ponieważnμE[|Yn|]nE[Yn]=E[Yn]Var(Yn)E[Yn]=nμVar(Yn)σ24μE[|Yn|]nμσ24μ

|Yn|nμσ24μσ/2μdN(0,1)
nμσ24μnμ0 jako .n
S. Catterall Przywróć Monikę
źródło
Może być konieczne dodanie jako aby uzyskać mój wyniknμnμσ24μ0n
Henry
@Henry można zastąpić o dla każdego stałego a to nie zmienia dystrybucji ograniczającą, ale można go zmieniać w jakim stopniu to dobre przybliżenie do dla określonego dużego . Jak wymyśliłeś ? nμnμkk|Yn|nμkσ/2μN(0,1)nnμσ24μ
S. Catterall Reinstate Monica
Mamy więc . Zakładając, że wszystko jest dodatnie, a mianownik sugeruje i połączenie tych prowadzi do . Var(Z)=E[Z2](E[Z])2 E[Z2]=E[Y]=nμE[Z]=E[Z2]Var(Z)E[Z2]=E[Y]=nμ Var(Z)σ2|Yn|nμσ/2μ E[Z]Var(Z)σ24μE[Z]nμσ24μ
Henry
Ok, dziękuję, próbowałem teraz opisać to w mojej odpowiedzi.
S. Catterall Przywróć Monikę