To bardzo podstawowe pytanie. Dlaczego używamy rozkładu chi-kwadrat? Jakie jest znaczenie tej dystrybucji? Dlaczego ten rozkład służy do tworzenia przedziału ufności dla wariancji?
Każde miejsce, w którym szukam wyjaśnień, po prostu przedstawia ten fakt, wyjaśniając, kiedy używać chi, ale nie wyjaśniając, dlaczego używać chi i dlaczego wygląda tak, jak to działa.
Ogromne podziękowania dla każdego, kto może skierować mnie w dobrym kierunku i to jest - naprawdę rozumiem, dlaczego używam chi, kiedy tworzę przedział ufności dla wariancji.
variance
chi-squared
nafrtiti
źródło
źródło
Odpowiedzi:
Szybka odpowiedź
Powodem jest to, że zakładając, że dane to iid iXja∼ N.( μ , σ2)) , i definiujemy
przy tworzeniu przedziałów ufności, rozkład próbkowania związany z wariancją próbki (S2, pamiętaj, zmienna losowa!) Jest rozkładem chi-kwadrat (S2(N-1)/σ2∼χ2n-1), podobnie jak rozkład próbkowania związany ze średnią próbki jest standardowym rozkładem normalnym ((ˉX-μ)√
Długa odpowiedź
Przede wszystkim udowodnimy, że ma rozkład chi-kwadrat z N - 1 stopniami swobody. Następnie zobaczymy, jak ten dowód jest użyteczny przy ustalaniu przedziałów ufności dla wariancji i jak wygląda rozkład chi-kwadrat (i dlaczego jest tak użyteczny!). Zaczynajmy.S2(N−1)/σ2 N−1
Dowód
W tym celu być może musisz przyzwyczaić się do rozkładu chi-kwadrat w tym artykule w Wikipedii . Ten rozkład ma tylko jeden parametr: stopnie swobody, , i zdarza się, że ma funkcję generowania momentu (MGF) podaną przez: m χ 2 ν ( t ) = ( 1 - 2 t ) - ν / 2 . Jeśli możemy wykazać, że rozkład S 2 ( N - 1 ) / σ 2 ma funkcję generującą moment taki jak ten, ale z ν =ν
Jeśli zdefiniujemy, gdzieZi∼N(0,1), tj. standardowe normalne zmienne losowe, funkcja generowania momentuYjest dana przez m Y (t)
Calculating the Confidence Interval for the variance.
When looking for a confidence interval for the variance, you want to know the limitsL1 and L2 in
źródło