Dlaczego rozkład wariancji próbkowania jest rozkładem kwadratowym chi?

22

Wyrok

Rozkład próbkowania wariancji próbki jest rozkładem kwadratowym chi ze stopniem swobody równym , gdzie jest rozmiarem próbki (biorąc pod uwagę, że losowa zmienna będąca przedmiotem zainteresowania jest zwykle rozkładana).n-1n

Źródło

Moja intuicja

Ma to dla mnie intuicyjny sens 1), ponieważ test chi-kwadrat wygląda jak suma kwadratu i 2) ponieważ rozkład chi-kwadrat jest po prostu sumą kwadratowego rozkładu normalnego. Ale nadal nie rozumiem tego dobrze.

Pytanie

Czy to stwierdzenie jest prawdziwe? Czemu?

Remi.b
źródło
1
Wstępne oświadczenie jest ogólnie fałszywe (jest fałszywe z dwóch różnych powodów). Jakie jest twoje źródło (brakuje twojego linku) i co tak naprawdę mówi?
Glen_b
Moje pytanie dotyczy także reakcji na pytanie-odpowiedź w klasie statystyk wprowadzających, dla której dostęp jest chroniony. Pytanie brzmi: „Jakim rozkładem jest rozkład próbkowania wariancji długości skrzydeł u much?” a odpowiedź brzmi „Rozkład chi-kwadrat”
Remi.b
1
Cytowane oświadczenie w pierwszym komentarzu jest ogólnie nadal fałszywe. Komentarz na końcu źródła jest prawdziwy (przy niezbędnych założeniach): „ gdy próbki wielkości n są pobierane z rozkładu normalnego o wariancji , rozkład próbkowania ( n - 1 ) s 2 / σ 2 ma rozkład chi-kwadrat z n-1 stopniami swobody.σ2)(n-1)s2)/σ2) ”... Odpowiedź na pytanie w twoim drugim komentarzu również będzie fałszywa - chyba, że, jak sądzę, ktoś wykazał, że długość skrzydła jest zwykle rozkładana. (Jaka może być podstawa do stwierdzenia, że ​​to prawda?)
Glen_b
Załóżmy więc, że skrzydła są normalnie rozłożone, to rozkład próbkowania byłby rozkładem chi-kwadrat. Dlaczego tak jest (n-1)s2)/σ2)
Remi.b
Czy wiesz, że suma kwadratów zmiennych losowych iid N (0,1) jest chi-kwadrat z k df? Czy jest to część, której szukasz? kk
Glen_b

Odpowiedzi:

27

[Przyjmę z dyskusji w twoim pytaniu, że z przyjemnością przyjmiesz fakt, że jeśli są niezależnymi identycznie rozmieszczonymi N ( 0 , 1 ) zmiennymi losowymi, to k i = 1 Z 2 iχ 2 k .]Zi,i=1,2,,kN(0,1)ja=1kZja2)χk2)

Formalnie wynik, którego potrzebujesz, wynika z twierdzenia Cochrana . (Chociaż można to pokazać na inne sposoby)

Mniej formalnie, należy wziąć pod uwagę, że gdybyśmy znali średnią populacji i oszacowali wariancję na jej temat (a nie na temat średniej próby): , a następnies 2 0 /σ2=1s02)=1nja=1n(Xja-μ)2) , (Zi=(Xi-μ)/σ), który będzie wynosił1s02)/σ2)=1nja=1n(Xja-μσ)2)=1nja=1nZja2)Zja=(Xja-μ)/σ razy× 2 n zmiennych losowych.1nχn2)

Fakt, że zastosowano średnią z próby, zamiast średniej populacji ( ), zmniejsza sumę kwadratów odchyleń, ale w taki sposób, że n i = 1 ( Z i ) 2Zja=(Xja-X¯)/σ (o których patrz twierdzenie Cochrana). Dlatego zamiast n s 2 0 / σ 2χ 2 n mamy teraz ( n - 1 ) s 2 / σ 2χ 2 n - 1 .ja=1n(Zja)2)χn-12)ns02)/σ2)χn2)(n-1)s2)/σ2)χn-12)

Glen_b - Przywróć Monikę
źródło
@Glen_b Czy możesz podać odniesienia do innych dowodów na ten fakt? Naprawdę chcę to wiedzieć.
Henry.L
Który z kilku faktów jesteś po dowodzie?
Glen_b
@Glen_b Jedynymi dwiema metodami oprócz twierdzenia Cochrana-Madow'a o udowodnieniu tego faktu, że wariancja próbki i średnia próbki są statystycznie niezależne z rozkładem chi-kwadrat to: (1) Podstawa kanoniczna Scheffe'a (Scheffe, 1959) (2) Metody kumulatywne (Lub mgfs, co jest równoważne). Jeśli znasz więcej metod, naprawdę chcę je poznać.
Henry.L,
Jeszcze jeden komentarz, który chcę dodać, jest taki, że używana jest średnia próbki, ale czasami chcemy stałej mocy niezależnej od ustalonej wariancji, tę metodę zastępuje się dwustopniową metodą Steina (1949).
Henry.L,
X¯Xjas