Niech zostanie narysowany na podstawie rozkładu t Studenta z stopniami swobody, dla średniej wielkości (powiedzmy mniej niż 100). Zdefiniuj Czy rozłożone prawie jak chi-kwadrat o stopniach swobody? Czy istnieje coś takiego jak Centralne Twierdzenie Graniczne dla sumy kwadratowych zmiennych losowych?
chi-squared
central-limit-theorem
t-distribution
shabbychef
źródło
źródło
Odpowiedzi:
Odpowiadając na pierwsze pytanie.
Możemy zacząć od faktu odnotowanego przez mpiktas, że . A potem spróbuj najpierw prostszego kroku - poszukaj rozkładu sumy dwóch zmiennych losowych dystrybuowanych przez . Można tego dokonać albo przez obliczenie splotu dwóch zmiennych losowych, albo przez obliczenie iloczynu ich charakterystycznych funkcji.F ( 1 , n )t2∼F(1,n) F(1,n)
Artykuł pokazy PCB Phillips, że moje pierwsze przypuszczenie o „[confluent] hipergeometryczny funkcji” zaangażowanych było prawdą. Oznacza to, że rozwiązanie nie będzie trywialne, a brutalna siła jest skomplikowana, ale jest warunkiem koniecznym do udzielenia odpowiedzi na twoje pytanie. Ponieważ jest stałe, a podsumowując rozkłady t, nie jesteśmy pewni, jaki będzie ostateczny wynik. Chyba że ktoś ma dobrą umiejętność zabawy z produktami zlewających się funkcji hipergeometrycznych.n
źródło
To nie jest nawet bliskie zbliżenie. Dla małego oczekiwanie T równe jest k nn T podczas gdy oczekiwanieχ2(k)jest równek. Kiedykjest małe (powiedzmy mniej niż 10), histogramylog(T)ilog(χ2(k))nawet nie mają tego samego kształtu, co wskazuje, że przesuwanie i przeskalowanieTnadal nie będzie działać.knn−2 χ2(k) k k log(T) log(χ2(k)) T
Intuicyjnie, dla małych stopni swobody, Studenta jest gruboogoniasty. Kwadrat to podkreśla tę ciężkość. Sumy będą zatem bardziej wypaczone - zwykle znacznie bardziej wypaczone - niż sumy kwadratów normalnych ( rozkład χ 2 ). Potwierdzają to obliczenia i symulacje.t χ2
Ilustracja (zgodnie z życzeniem)
Każdy histogram przedstawia niezależną symulację 100 000 prób z określonymi stopniami swobody ( ) i sumami ( k ), standaryzowanymi zgodnie z opisem @mpiktas. Wartość n = 9999 w dolnym rzędzie jest zbliżona do przypadku χ 2 . W ten sposób można porównać T do χ 2 , skanując każdą kolumnę.n k n=9999 χ2 T χ2
Zauważ, że standaryzacja nie jest możliwa dla ponieważ odpowiednie momenty nawet nie istnieją. Brak stabilności kształtu (podczas skanowania od lewej do prawej w dowolnym rzędzie lub od góry do dołu w dół dowolnej kolumny) jest jeszcze bardziej zaznaczony dla n ≤ 4 .n<5 n≤4
źródło
Odpowiem na drugie pytanie. Twierdzenie o granicy centralnej dotyczy dowolnej sekwencji iid, kwadratowej lub kwadratowej. Więc w twoim przypadku, jeśli jest wystarczająco duże, mamyk
gdzie i V a r ( t 2 1 ) jest odpowiednio średnią i wariancją kwadratowego rozkładu t Studenta zEt21 Var(t21) stopni swobody. Zauważ, że t 2 1 jest podzielony jako rozkład F z 1 i n stopniami swobody. Możemy więc pobrać wzory na średnią i wariancję zestrony wikipedii. Ostateczny wynik to:n t21 1 n
źródło