Zaintrygowany pytaniem z math.stackexchange i badając go empirycznie, zastanawiam się nad następującym stwierdzeniem o pierwiastku kwadratowym sum iid zmiennych losowych.
Załóżmy że są zmiennymi losowymi o skończonej niezerowej średniej i wariancji , a . Twierdzenie o granicy centralnej mówi gdy wzrasta. μ σ 2 Y = n ∑ i = 1 X i Y - n μn
Jeśli , czy mogę również powiedzieć coś takiego jak miarę wzrostu ?Z - √n
Załóżmy na przykład, że są Bernoullim ze średnią i wariancją , wtedy jest dwumianowy i mogę to zasymulować w R, powiedzmy za pomocą : p p ( 1 - p ) Y
set.seed(1)
cases <- 100000
n <- 1000
p <- 1/3
Y <- rbinom(cases, size=n, prob=p)
Z <- sqrt(abs(Y))
co daje w przybliżeniu oczekiwaną średnią i wariancję dla
> c(mean(Z), sqrt(n*p - (1-p)/4))
[1] 18.25229 18.25285
> c(var(Z), (1-p)/4)
[1] 0.1680012 0.1666667
oraz wykres QQ, który wygląda jak Gaussa
qqnorm(Z)
Odpowiedzi:
Konwergencja do Gaussa jest rzeczywiście zjawiskiem ogólnym.
Załóżmy, że są losowymi zmiennymi IID o średniej i wariancji , i zdefiniuj sumy . Napraw liczbę . Zwykłe twierdzenie o centralnym mówi nam, że as , gdzie to standardowy normalny plik cdf. Jednak ciągłość ograniczającego cdf oznacza, że mamy równieżX1,X2,X3,... μ>0 σ2 Yn=∑ni=1Xi α P(Yn−nμσn√≤α)→Φ(α) n→∞ Φ
Biorąc pierwiastki kwadratowe i zauważając, że oznacza, że , otrzymujemy Innymi słowy, . Ten wynik pokazuje konwergencję do gaussowskiego w granicy jako .μ>0 P(Yn<0)→0
Czy to oznacza, że jest dobrym przybliżeniem do dla dużego ? Cóż, możemy zrobić lepiej niż to. Jak zauważa @Henry, zakładając, że wszystko jest pozytywne, możemy użyć , razem z i przybliżenie , aby uzyskać ulepszone przybliżenie jak podano w powyższym pytaniu. Zauważ też, że wciąż mamy ponieważnμ−−−√ E[|Yn|−−−√] n E[Yn−−√]=E[Yn]−Var(Yn−−√)−−−−−−−−−−−−−−−√ E[Yn]=nμ Var(Yn−−√)≈σ24μ E[|Yn|−−−√]≈nμ−σ24μ−−−−−−−√
źródło