Jak uzyskać rozkład normalny jako jeśli zakres wartości naszej zmiennej losowej jest ograniczony?

12

Powiedzmy, że mamy zmienną losową z zakresu wartości ograniczonego a , gdzie jest wartością minimalną i wartości maksymalnej.abab

Powiedziano mi, że jako , gdzie jest naszą wielkością próby, rozkład próbkowania naszych średnich próbek jest rozkładem normalnym. Oznacza to, że wraz ze wzrostem zbliżamy się coraz bardziej do rozkładu normalnego, ale rzeczywisty limit od jest równy rozkładowi normalnemu.nnnn

Czy jednak nie jest częścią definicji rozkładu normalnego, który musi rozciągać się od do ?

Jeśli maksimum naszego zakresu wynosi , wówczas maksymalna średnia próbki (niezależnie od wielkości próbki) będzie równa , a minimalna średnia próbki będzie równa .bba

Wydaje mi się więc, że nawet jeśli przyjmiemy limit, gdy zbliża się do nieskończoności, nasz rozkład nie jest rzeczywistym rozkładem normalnym, ponieważ jest ograniczony przez i .nbab

Czego mi brakuje ?

Jeremy Radcliff
źródło

Odpowiedzi:

15

Oto czego brakuje. Rozkład asymptotycznej, nie ma (Średnią próbki), ale , w którym jest średnią .X¯nθXn(X¯nθ)θX

Niech będą zmiennymi losowymi takimi, że a ma średnią i wariancję . W ten sposób ograniczyło obsługę. CLT mówi, że a < X i < b X i θ σ 2 X i X1,X2,a<Xi<bXiθσ2Xi

n(X¯nθ)dN(0,σ2),

gdzie jest średnią próbki. TerazX¯n

a<Xi<ba<X¯n<baθ<X¯nθ<bθn(aθ)<n(X¯nθ)<n(bθ).

Gdy , dolna granica i górna granica mają tendencję do odpowiednio i , a zatem jako obsługa to dokładnie cała prawdziwa linia.- n nnn(X¯nθ)

Ilekroć używamy CLT w praktyce, mówimy , i zawsze będzie to przybliżenie.X¯nN(θ,σ2/n)


EDYCJA: Myślę, że część zamieszania wynika z błędnej interpretacji Twierdzenia o granicy centralnej. Masz rację, że rozkład próbkowania średniej próbki wynosi

X¯nN(θ,σ2/n).

Jednak rozkład próbkowania jest właściwością próbki skończonej. Jak powiedziałeś, chcemy pozwolić ; gdy to zrobimy, znak będzie dokładnym wynikiem. Jeśli jednak pozwolimy , nie możemy już mieć po prawej stronie (ponieważ jest teraz ). Zatem poniższa instrukcja jest niepoprawnannnn

X¯ndN(θ,σ2/n) as n.

[Tutaj oznacza zbieżność pod względem dystrybucji]. Chcemy dokładnie zapisać wynik, aby nie było po prawej stronie. Tutaj używamy teraz właściwości losowych zmiennych do uzyskaniadn

n(X¯nθ)dN(0,σ2)

Aby zobaczyć, jak działa algebra, spójrz na odpowiedź tutaj .

Greenparker
źródło
Dziękuję Ci. Rozumiem twoją algebrę nierówności, ale nadal mam pewne wątpliwości co do twojego pierwszego akapitu: „Rozkład asymptotyczny nie dotyczy (średnia próbki), ale ... ". Myślałem, że CLT powiedział, że rozkład próbkowania średnich próbek zbliża się do rozkładu normalnego jako , i pomyślałem, że jest RV, który przyjmuje wszystkie możliwe wartości próbek o wielkości . Skąd pochodzi ? Dlaczego interesuje nas ta dystrybucja, a nie dystrybucja ? X¯nn(X¯nθ)nX¯nnn(X¯nθ)X¯n
Jeremy Radcliff
(kont.) Czy chodzi o normalizację rozkładu średnich próbek? Czy stąd pochodzi pierwiastek kwadratowy? Czy to ma związek z wynikami ? Z
Jeremy Radcliff
@jeremyradcliff Zredagowałem swoją odpowiedź i zamieściłem link, który wyjaśnia niektóre szczegóły. Mam nadzieję, że teraz ma to większy sens.
Greenparker
1
Dziękuję bardzo za poświęcenie czasu na edycję, podany link jest dokładnie tym, czego szukałem. I masz rację, problem było to, że miałem problemy pogodzenia skończony charakter dystrybucji próbek oraz fakt, że jesteśmy biorąc na . n
Jeremy Radcliff
7

Jeśli odwołujesz się do centralnego twierdzenia o limicie, zauważ, że jednym z prawidłowych sposobów jego wypisania jest

(x¯μσ)ndN(0,1)

w normalnych warunkach ( jest średnią i odchyleniem standardowym ).x iμ,σxi

Dzięki tej formalnej definicji od razu widać, że lewa strona może przyjmować wartości dla dowolnego skończonego zakresu, biorąc pod uwagę wystarczająco dużą wartość .n

Aby pomóc połączyć się z nieformalnych idei, że „średnia zbliża się do rozkładu normalnego dla dużych ”, musimy zdać sobie sprawę, że „zbliża się do rozkładu normalnego” oznacza, że dostać CDF w dowolnie blisko do rozkładu normalnego jako dostaje duże. Ale gdy staje się duże, odchylenie standardowe tego przybliżonego rozkładu zmniejsza się, więc prawdopodobieństwo ekstremalnego ogona zbliżonej normy również spada do 0.n nnnn

Załóżmy na przykład . Następnie możesz użyć nieformalnego przybliżenia, aby to powiedziećXiBern(p=0.5)

X¯˙N(p,p(1p)n)

Więc chociaż prawdą jest, że dla dowolnego skończonego ,n

P(N(p,p(1p)n)<0)>0

(sugerując, że przybliżenie nigdy nie jest doskonałe), ponieważ ,n

P(N(p,p(1p)n)<0)0

Tak że rozbieżność pomiędzy rzeczywistą dystrybucji i dystrybucji przybliżonej jest znikają, jak ma się dziać z przybliżeń.

Cliff AB
źródło