Centralne twierdzenie graniczne a prawo wielkich liczb

14

Twierdzenie o granicy centralnej stwierdza, że ​​średnia zmiennych iid, gdy przechodzi w nieskończoność, staje się normalnie rozkładem.N

Rodzi to dwa pytania:

  1. Czy możemy z tego wywnioskować prawo wielkich liczb? Jeśli prawo wielkich liczb mówi, że średnia próbki wartości zmiennej losowej jest równa prawdziwej średniej gdy przechodzi w nieskończoność, wydaje się jeszcze silniejsze stwierdzenie, że (jak mówi środkowa granica) wartość staje się gdzie jest odchyleniem standardowym. Czy można zatem powiedzieć, że centralny limit implikuje prawo wielkich liczb?N N ( μ , σ ) σμNN(μ,σ)σ
  2. Czy centralne twierdzenie o granicy dotyczy liniowej kombinacji zmiennych?
użytkownik9097
źródło
5
Twoje twierdzenie, że „centralne twierdzenie graniczne stwierdza, że ​​średnia zmiennych iid, gdy przechodzi w nieskończoność, staje się normalnie rozkładem” jest błędne. Zobacz moją odpowiedź na to ostatnie pytanie, które rodzi podobne problemy. Kolejna odpowiedź na to pytanie została opublikowana, ale wkrótce potem usunięta, a dyskusja po tej odpowiedzi, teraz już nieobecna, również omawiała te kwestie. N
Dilip Sarwate,
1
Dlaczego średnia próbki zbiegająca się ze średnią populacji jest słabszym wynikiem niż średnia próbki zbiegająca się z próbką z rozkładu ? N ( μ , σ )μN(μ,σ)
Dilip Sarwate
@DilipSarwate Dzięki za flagę, ale Twój komentarz jest na IMO wystarczająco ujawnić nieporozumienia w pytaniu i pojawiły się rozsądne odpowiedzi.

Odpowiedzi:

10

OP mówi

Twierdzenie o granicy centralnej stwierdza, że ​​średnia zmiennych iid, gdy N przechodzi w nieskończoność, staje się normalnie rozkładem.

Przyjmuję to, że OP jest przekonany, że dla iid zmiennych losowych ze średnią i odchyleniem standardowym , skumulowana funkcja rozkładu z zbieżna z funkcją skumulowanego rozkładu , normalnej zmiennej losowej ze średnią i odchyleniem standardowym . Lub OP uważa, że ​​drobne zmiany aranżacji tej formuły, np. Rozkład zbieżny z rozkładem lub rozkładem μ σ F Z n ( a ) Z n = 1XiμσFZn(a)N(μ,σ)μσZn-μN(0,σ)(Zn-μ)/σN(0,1)P{| Zn-μ| >σ}=1-FZn(μ+σ

Zn=1ni=1nXi
N(μ,σ)μσZnμN(0,σ)(Znμ)/σzbiega się z rozkładem , standardowej normalnej zmiennej losowej. Zauważ, że jako przykład te stwierdzenia sugerują, że jako .N(0,1)
P{|Znμ|>σ}=1FZn(μ+σ)+FZn((μ+σ))1Φ(1)+Φ(1)0.32
n

OP mówi dalej

Rodzi to dwa pytania:

  1. Czy możemy z tego wywnioskować prawo wielkich liczb? Jeśli prawo dużych liczb mówi, że średnia próbki wartości zmiennej losowej jest równa prawdziwej średniej μ, gdy N idzie w nieskończoność, to jeszcze silniejsze wydaje się stwierdzenie (jak mówi środkowa granica), że wartość staje się N ( μ, σ) gdzie σ jest odchyleniem standardowym.

Słaba zasada dużych liczb mówi, że dla iid zmiennych losowych ze skończoną średnią , biorąc pod uwagę dowolne , Należy pamiętać, że nie trzeba zakładać, że odchylenie standardowe jest skończone.Xiμϵ>0

P{|Znμ|>ϵ}0  as n.

Aby odpowiedzieć na pytanie PO,

  • Twierdzenie o centralnym limicie, określone przez PO , nie implikuje słabego prawa wielkich liczb. Jako , wersja centralnego twierdzenia granicznego OP mówi, że podczas gdy słabe prawo mówi, żenP{|Znμ|>σ}0.317P{|Znμ|>σ}0

  • Z poprawnego stwierdzenia centralnego twierdzenia o granicy można w najlepszym razie wywnioskować tylko ograniczoną formę słabego prawa wielkich liczb, mającego zastosowanie do zmiennych losowych o średniej skończonej i odchyleniu standardowym. Ale słabe prawo dużych liczb obowiązuje również dla zmiennych losowych, takich jak zmienne losowe Pareto ze skończonymi średnimi, ale nieskończonymi odchyleniami standardowymi.

  • Nie rozumiem, dlaczego stwierdzenie, że średnia próbki jest zbieżna do normalnej zmiennej losowej z niezerowym odchyleniem standardowym, jest silniejszym stwierdzeniem niż stwierdzenie, że średnia próbki jest zbieżna ze średnią populacji, która jest stałą (lub zmienną losową o zerowym odchyleniu standardowym, jeśli lubisz).

Dilip Sarwate
źródło
Zastanawiam się, co osoba, która przegłosowała moją odpowiedź, uznała to za niewłaściwe lub niepoprawne w tym, co powiedziałem.
Dilip Sarwate,
7

W przypadku prawa dużych liczb należy zdefiniować wszystkie zmienne w tej samej przestrzeni prawdopodobieństwa (ponieważ prawo dużych liczb jest stwierdzeniem prawdopodobieństwa zdarzenia określonego przez , dla wszystkich jednocześnie). Aby uzyskać zbieżność w rozkładzie, możesz mieć różne przestrzenie prawdopodobieństwa, co upraszcza wiele aspektów proofów (np. Zwiększenie zagnieżdżonych przestrzeni, bardzo powszechne dla różnych proofów z układem trójkątnym). Ale oznacza to również, że nie możesz powiedzieć żadnych oświadczeń dotyczących wspólnych rozkładów i . Zatem nie, zbieżność w rozkładzie nie implikuje prawa wielkich liczb, chyba że masz wspólną przestrzeń prawdopodobieństwa dla wszystkich zmiennych.X¯nnX¯nX¯n+1

StasK
źródło
(+1) To, co mówisz, jest prawdą i bardzo ważną kwestią. Trójkątna tablica pozwala zmiennym w każdym „rzędzie” żyć w innych przestrzeniach prawdopodobieństwa niż w poprzednich rzędach. Z drugiej strony, jeśli mówimy a priori, że rozważamy sekwencję zmiennych losowych iid, wówczas domyślnie muszą one istnieć na wspólnej, podstawowej przestrzeni, aby pojęcie niezależności miało sens.
kardynał
@ cardinal: więc jeśli dobrze rozumiem, w „prostym” przypadku, w którym wszystkie są zdefiniowane w tej samej przestrzeni, to czy centralność implikuje prawo wielkich liczb? albo nie?
user9097,
@ user9097 Skoro wchodzimy teraz w sferę drobnych szczegółów, o jakie prawo wielkich liczb pytamy ? Słabe prawo czy silne prawo?
Dilip Sarwate
Ta prawda dotyczy tylko silnego prawa wielkich liczb , a nie słabego prawa
kjetil b halvorsen
4

Po pierwsze, chociaż istnieje wiele definicji, jedna ze standardowych form centralnego twierdzenia o granicy mówi, że zbieżny w rozkładzie do gdzie jest średnią próbkę IID kopie około zmiennej losowej .n(X¯nEX)N(0,Var(X))X¯nX

Po drugie, załóżmy, że mamy dwa niezależne zmienne losowe i . Następnie lub XY

n(1nj=1n(aXj+Yj)E(aX+Y))N(0,Var(aX+Y))
na(X¯nEX)+n(Y¯nEY)N(0,a2Var(X)+Var(Y)).

Innymi słowy, liniowa kombinacja zmiennych losowych nie będzie zbieżna z liniową kombinacją normalnych pod CLT, tylko jedną normalną. Ma to sens, ponieważ liniowa kombinacja zmiennych losowych jest po prostu inną zmienną losową, do której można bezpośrednio zastosować CLT.

Daniel Johnson
źródło
1
To dobry początek odpowiedzi. Oto kilka komentarzy: Liniowa kombinacja (wspólnych) normalnych jest normalna, więc nie jestem pewien, co miał oznaczać twój komentarz w tym względzie. W każdym razie podejrzewam, że OP nie myślał o liniowych kombinacjach rozważanej formy. Zauważając, że gdzie dla każdego , naturalnym pytaniem, które można zadać, jest to, co dzieje się, gdy zastępujemy te „jednolite” ciężarki niektórymi (bardziej arbitralnymi). Kiedy nadal otrzymujemy CLT? Można użyć CLT Lindeberga, aby uzyskać odpowiedź na to pytanie. X¯n=i=1nwniXiwni=1/ni=1,,n
kardynał
Myślę, że przy ścisłych warunkach mój wynik nadal powie coś o . Najpierw zdefiniujmy te warunki, a następnie zastanówmy się, jak je osłabić. Weźmy i jako pojedynczą, nieskończoną sekwencję nieujemnych reali. Jeśli liczba różnych jest skończona i każdy pojawia się nieskończenie często w sekwencji, mój wynik powinien się utrzymać, ponieważ każdy definiuje zmienną losową, co pasuje do ramy „kombinacji liniowej”, którą podałem powyżej. Następnie dobre pytanie byłoby, gdybyśmy mogli pozwolić liczba różnych skali z . j=1nwnjXjwnj=wj/nwjwjwjXwn
Daniel Johnson
1
To dobry komentarz i fajny pomysł, jednak uważam, że do modyfikacji potrzebowałby pewnych modyfikacji. Załóżmy wlog, że . Skonstruuj swój w następujący sposób. Niech , . Teraz zdefiniuj indukcyjnie w następujący sposób: Ustaw aż . Następnie dołączaj te, aż . Dodaj ponownie zera, a potem jedynki. Powtórz ad infinitum. Teraz i występują nieskończenie wiele razy, ale wariancja przeskalowanej średniej oscyluje między aW J w 1 = 1 W 2 = 0 w j wag j = 0 Σ j i = 1 W I / j 1 / 4 Ď j i = 1 W I / j 1 / 2 0 1 1 / 2 1 / 4EX=0wjw1=1w2=0wjwj=0i=1jwi/j1/4i=1jwi/j1/2011/21/4(w przybliżeniu). Zatem podana sekwencja nie może zbiegać się w dystrybucji.
kardynał
(Uwaga: tutaj nie ma nic specjalnego w wyborze i Ponadto, ściśle mówiąc, procedura opisana w komentarzu tak naprawdę nie mieści się w ramach kombinacji liniowej twojej odpowiedzi.)101
kardynał