Dowód centralnego limitu twierdzenia nie wykorzystujący funkcji charakterystycznych

11

Czy jest jakiś dowód na to, że CLT nie używa funkcji charakterystycznych, prostszej metody?

Może metody Tichomirowa lub Steina?

Coś samodzielnego, co możesz wyjaśnić studentowi uniwersytetu (pierwszy rok matematyki lub fizyki) i zajmuje mniej niż jedną stronę?

skan
źródło
2
Naszkicowałem takie elementarne podejście na stronie stats.stackexchange.com/a/3904/919 . Prawdopodobnie użycie funkcji generowania skumulowanego jest najprostszą możliwą metodą: twoje „prostsze” prawdopodobnie ma na celu przeczytanie „bardziej elementarnych”.
whuber
2
W bardziej restrykcyjnych warunkach niż przy użyciu funkcji charakterystycznych można zamiast tego użyć funkcji generujących moment (rzeczywiście pierwszy CLT, który widziałem, miał taką postać) - ale ekspozycja jest dość podobna.
Glen_b
@Glen_b Pomyślałem również, że chwile mogą być łatwiejsze. W każdym razie pozostawię otwarte pytanie na wypadek, gdyby ktoś inny napisał inną demonstrację.
skan
Jako dowód, nie jest to wcale łatwiejsze (dowód z cfs można napisać w tej samej formie, co dowód z mgfs), ale może być preferowany dla studentów, którzy nie mają żadnego doświadczenia z funkcjami obejmującymi . Oznacza to, że możesz zaoszczędzić na wprowadzaniu nowych pojęć, ale jeśli mają one już te pojęcia, dowód odpowiedniego stwierdzenia z cfs wcale nie jest trudniejszy (choć jest bardziej ogólny). To, czy jest to lepsze, zależy od uczniów, z którymi masz do czynienia. ja
Glen_b
Przypominam sobie, że mój profesor pierwszego roku statystyki przedstawił wizualny „dowód” CLT, pokazując rozkłady próbkowania średniej przy w różnych modelach prawdopodobieństwa. Normalne, oczywiście, nie wykazywało tendencji, ale wykładnicze, bernoulli i różne rozkłady o grubych ogonach wszystkie „zaokrąglone” do znanego kształtu wizualnie na każdy wzrost n . n=10,100,1000n
AdamO

Odpowiedzi:

6

Możesz to udowodnić metodą Steina, jednak jest to dyskusyjne, jeśli dowód jest elementarny. Plusem metody Steina jest to, że dostajesz nieco słabszą formę granic Berry Esseen zasadniczo za darmo. Ponadto metoda Steina to czarna magia! Opis dowodu można znaleźć w sekcji 6 tego linku . W linku znajdziesz także inne dowody CLT.

Oto krótki zarys:

1) Wykazać, używając prostej całkowania przez części i normalnej gęstości rozkładu, że dla wszystkich ciągle różnicowalnych iff A jest rozkładem N ( 0 , 1 ) . Łatwiej pokazać normalny implikuje wynik i nieco trudniej pokazują coś przeciwnego, ale może to być zrobione na wierze.mifa(ZA)-Xfa(ZA)=0ZAN.(0,1)ZA

2) Ogólnie, jeśli dla każdego ciągłego różniczkowej f o f , f ' ograniczona, a X n jest zbieżny do N ( 0 , 1 ) w dystrybucji. Dowodem na to jest integracja części, z pewnymi sztuczkami. W szczególności musimy wiedzieć, że zbieżność w rozkładzie jest równoważna E g ( X n ) Emifa(Xn)-Xnfa(Xn)0fafa,faXnN.(0,1) dla wszystkich ograniczonych funkcji ciągłych g . Naprawa g służy do przeformułowania:misol(Xn)misol(ZA)solsol

misol(Xn)-misol(ZA)=mifa(Xn)-Xnfa(Xn),

gdzie rozwiązuje się stosując podstawową teorię ODE, a następnie pokazuje, że f jest niezła. Tak więc, jeśli możemy znaleźć takie fajne f , z założenia rhs przyjmuje wartość 0, a więc i lewą stronę.fafafa

3) Na koniec udowodnij centralne twierdzenie graniczne dla gdzieXioznacza się ze średnią 0 i wariancją 1. To ponownie wykorzystuje lewę w kroku 2, gdzie dla każdegogznajdujemyftakie, że:Yn: =X1++XnnXjasolfa

misol(Xn)-misol(ZA)=mifa(Xn)-Xnfa(Xn).
Alex R.
źródło
6

Oto jak bym to zrobił, gdybym był w liceum.

Weź dowolny rozkład prawdopodobieństwa o gęstości , uzyskaj jego średnią i wariancję μ x , σ 2 x . Następnie, w przybliżeniu jej zmiennej losowej Z , który ma następującą postać: z = μ x - σ x + 2 σ x ξ , gdzie ξ jest Bernoulliego zmienną losową z parametru p = 1 / 2 . Widać, że μ z = μ x ifa(x)μx,σx2)z

z=μx-σx+2)σxξ,
ξp=1/2)μz=μx .σz2)=σx2)

Teraz możemy spojrzeć na sumę = n ( μ x - σ x ) + 2 σ x n i = 1 ξ i

S.n=ja=1nzja
=n(μx-σx)+2)σxja=1nξja

Można rozpoznać rozkładu dwumianowego tutaj: , gdzie η ~ B ( n , 1 / 2 ) . Nie potrzebujesz funkcji charakterystycznej, aby zobaczyć, że jest zbieżna z kształtem rozkładu normalnego .η=ja=1nξjaηb(n,1/2))

W pewnym sensie można powiedzieć, że Bernoulli jest najmniej dokładnym przybliżeniem dla dowolnego rozkładu, a nawet zbiega się w normie.

Na przykład możesz pokazać, że chwile pasują do normy. Zdefiniujmy zmienną: y=(S.n/n-μx)n

y=σx(-1+2)η/n)n

μy=σx(-1+2)(n/2))/n)n=0
V.zar[y]=σx2)V.zar[2)η/n]n=4σx2)/nn(1/4)=σx2)

n

Aksakal
źródło
Ciekawy. Czy można przekształcić ten pomysł w kompletny dowód?
Elvis
@Elvis, wiele lat temu próbowałem myśleć tak jak ja, i nie byłem zbytnio przekonany. Jedną rzeczą, o której myślałem, było przedstawienie ciągłego rozkładu jako kombinacji bernoullis, ale nie jestem pewien, czy to możliwe
Aksakal
To, co napisałeś powyżej, może być znacznie lepsze. Nie ma potrzeby dokładnego przybliżania rozkładu: przybliżone przybliżenie przez zmienną przyjmującą dwie różne wartości wykonałoby zadanie.
Elvis
Oznacza to, że jeśli możliwe jest ustalenie pewnego ograniczenia dokładności normalnego przybliżenia. Podobnie, normalne przybliżenie jest co najmniej tak samo dobre dla pierwotnego rozkładu, jak dla skalowanego Bernoulliego. Lub bardziej prawdopodobne coś słabszego, ale wciąż pozwalającego na zakończenie.
Elvis