Bardzo prosta wersja centralnego ograniczonego twierdzenia, jak poniżej
czyli Lindeberg – Lévy CLT. Nie rozumiem, dlaczegopo lewej stronieznajduje się. A Lyapunov CLT mówi
ale dlaczego nie? Czy ktoś powiedziałby mi, jakie są te czynniki, takie jaki? jak uzyskać je w twierdzeniu?
central-limit-theorem
intuition
Latająca świnia
źródło
źródło
Odpowiedzi:
Ładne pytanie (+1) !!
Zapamiętasz, że dla niezależnych zmiennych losowych i Y , V a r ( X + Y ) = V a r ( X ) + V a r ( Y ) i V a r ( a ⋅ X ) = a 2 ⋅ V a r ( X ) . Zatem wariancja ∑ n i = 1 X i wynosiX Y V.a r ( X+ Y) = Va r ( X) + V.a r ( Y) V.a r ( a ⋅ X) = a2)⋅ V.a r ( X) ∑ni = 1Xja , a wariancja ˉ X = 1∑ni = 1σ2)= n σ2) jestnσ2/n2=σ2/n.X¯= 1n∑ni = 1Xja n σ2)/ n2)= σ2)/ n
To jest dla wariancji . Aby ustandaryzować zmienną losową, należy podzielić ją przez odchylenie standardowe. Jak wiadomo, oczekiwana wartość wynosi μ , więc zmiennaX¯ μ
ma oczekiwaną wartość 0 i wariancję 1. Więc jeśli dąży do Gaussa, musi to być standardowy GaussianN(0,
Jeśli chodzi o twój drugi punkt, uważam, że powyższe równanie ilustruje, że musisz podzielić przez a nie √σ celu standaryzacji równania, wyjaśniając, dlaczego używaszsn(estymatorσ),a nie √σ--√ sn σ) .sn--√
Dodanie: @whuber sugeruje omówienie przyczyny skalowania przez . Robi totam, ale ponieważ odpowiedź jest bardzo długa, postaram się uchwycić esencję jego argumentacji (która jest rekonstrukcją myśli de Moivre'a).n--√
Jeśli dodasz dużą liczbę + 1 i -1, możesz oszacować prawdopodobieństwo, że suma wyniesie j poprzez elementarne zliczanie. Log tego prawdopodobieństwa jest proporcjonalny do - j 2 / n . Jeśli więc chcemy, aby powyższe prawdopodobieństwo zbiegło się do stałej, gdy n staje się duże, musimy zastosować współczynnik normalizujący w O ( √n jot - j2)/ n n .O ( n--√)
Korzystając z nowoczesnych narzędzi matematycznych (post de Moivre), można zobaczyć wspomniane wyżej przybliżenie, zauważając, że oczekiwane prawdopodobieństwo wynosi
które przybliżamy według wzoru Stirlinga
źródło
Istnieje ładna teoria, jaki rodzaj rozkładów może ograniczać rozkłady sum zmiennych losowych. Miłym źródłem jest następująca książka Petrowa, którą osobiście bardzo mi się podobała.
Okazuje się, że jeśli badasz limity tego typu gdzie X i są niezależnymi zmiennymi losowymi, rozkłady limitów są tylko niektórymi rozkładami.
W tej chwili krąży dużo matematyki, która sprowadza się do kilku twierdzeń, które całkowicie charakteryzują to, co dzieje się na granicy. Jednym z takich twierdzeń jest Feller:
Twierdzenie Niech Jest sekwencją niezależnych zmiennych losowych V n ( x ) jest funkcją rozkładu X, n i n jest sekwencją stałą dodatnią. Aby{Xn;n=1,2,...} Vn(x) Xn an
i
jest to konieczne i wystarczające
i
To twierdzenie daje następnie wyobrażenie o tym, powinno wyglądać n .an
Ogólna teoria w książce jest skonstruowana w taki sposób, że stała normalizacyjna jest w jakikolwiek sposób ograniczona, ale ostateczne twierdzenia, które dają niezbędne i wystarczające warunki, nie pozostawiają miejsca na stałą normalną inną niż .n−−√
źródło
s n oznacza odchylenie standardowe próbki dla średniej próbki. s n 2 jest wariancją próby dla średniej próbki i jest równa S n 2 / n. Gdzie S n 2 to oszacowanie próby wariancji populacji. Ponieważ s n = S n / thatn wyjaśnia, jak appearsn pojawia się w pierwszej formule. Zauważ, że w mianowniku byłby σ, gdyby limit byłn n 2 n 2 n 2 n n
N (0,1), ale granicę podano jako N (0, σ 2 ). Ponieważ S n jest spójnym oszacowaniem σ, jest używane w drugim równaniu do pobrania σ poza granicę.2 n
źródło
Intuicyjnie, jeśli dla niektórych σ 2 należy się spodziewać, że Var ( Z n ) jest w przybliżeniu równy σ 2 ; wydaje się to dość rozsądnym oczekiwaniem, choć nie sądzę, aby było to w ogóle konieczne. Powód √Zn→N(0,σ2) σ2 Var(Zn) σ2 w pierwszym wyrażeniu jest takie, że wariancja ˉ X n-μwynosi0jak 1n−−√ X¯n−μ 0 i tak√1n pompuje wariancję, tak że wyrażenie ma tylko wariancję równąσ2. W drugim wyrażeniu terminsnjest zdefiniowany jako √n−−√ σ2 sn , natomiast wariancja licznika rośnie jakĎ n i = 1 Var(XI), więc znów mamy że wariancja całego wyrażenia jest stałą (1, w tym przypadku).∑ni=1Var(Xi)−−−−−−−−−−−√ ∑ni=1Var(Xi) 1
Zasadniczo wiemy, że dzieje się coś „interesującego” z rozkładem , ale jeśli tego nie zrobimy poprawnie centrum i skalować go nie będzie w stanie go zobaczyć. Słyszałem, że to czasami wymaga dostosowania mikroskopu. Jeśli nie wysadzimy (np.) ˉ X -μo√X¯n:=1n∑iXi X¯−μ wtedy mamy po prostu ˉ X n-μ→0w rozkładzie według słabego prawa; interesujący wynik sam w sobie, ale nie tak pouczający jak CLT. Jeśli napompujemy przez jakikolwiek czynnikan,który jest zdominowany przez √n−−√ X¯n−μ→0 an , mamy jeszcze dostaćsięn( ˉ X n-| j)→0, gdy jakikolwiek czynniknktóry dominuje √n−−√ an(X¯n−μ)→0 an dajesięN( ˉ X n-| j)→∞. Okazuje się, że √n−−√ an(X¯n−μ)→∞ jest właściwym powiększeniem, aby móc zobaczyć, co się dzieje w tym przypadku (uwaga: cała zbieżność jest tutaj w rozkładzie; istnieje inny poziom powiększenia, który jest interesujący dla prawie pewnej zbieżności, co powoduje powstanie prawa iteracji logarytm).n−−√
źródło