Jest to problem z „7 Olimpiady Kołmogorowskiej w teorii prawdopodobieństwa”:
Biorąc pod uwagę jedno spostrzeżenie z rozkładu nazwa z oboma parametrami nieznanymi, podaj przedział ufności dla z poziomem ufności co najmniej 99%.Normalna ( μ , σ 2 ) σ 2
Wydaje mi się, że powinno to być niemożliwe. Mam rozwiązanie, ale jeszcze go nie przeczytałem. jakieś pomysły?
Wyślę rozwiązanie za kilka dni.
[Edycja uzupełniająca: oficjalne rozwiązanie opublikowane poniżej. Rozwiązanie kardynała jest dłuższe, ale daje lepszy przedział ufności. Dziękujemy również Maxowi i Glen_b za ich wkład.]
probability
normal-distribution
confidence-interval
variance
Jonathan Christensen
źródło
źródło
Odpowiedzi:
Patrząc przez pryzmat prawdopodobieństwa nierówności i powiązań z przypadkiem wielokrotnej obserwacji, wynik ten może nie wydawać się tak niemożliwy, a przynajmniej bardziej prawdopodobny.
Niech z i nieznane. Możemy napisać dla .μ σ 2 X = σ Z + μ Z ∼ N ( 0 , 1 )X∼N(μ,σ2) μ σ2 X=σZ+μ Z∼N(0,1)
Powód do optymizmu
Przypomnijmy, że w przypadku , gdy , typowy przedział ufności dla wynosi gdzie jest poziomowym kwantylem chi-kwadrat z stopni swobody. Dotyczy to oczywiście każdego . Chociaż jest to najbardziej popularny przedział (z oczywistych powodów nazywany interwałem o jednakowym ogonie ), nie jest to ani jedyny, ani nawet najmniejszy! Jak powinno być oczywiste, kolejnym ważnym wyborem jest T = ∑ n i = 1 ( X i - ˉ X ) 2 ( 1 - α ) σ 2 ( Tn ≥ 2 T.= ∑ni = 1( Xja- X¯)2) ( 1 - α ) σ2) q k , a a k μ ( 0 , T
Ponieważ , a następnie ma również zasięg co najmniej . ( 0 , ∑ n i = 1 X 2 iT≤∑ni=1X2i ( 1 - α )
Patrząc w tym świetle, możemy być optymistami, że przedział w głównym twierdzeniu jest prawdziwy dla . Główna różnica polega na tym, że w przypadku pojedynczej obserwacji nie ma rozkładu chi-kwadrat o zerowym stopniu swobody, więc musimy mieć nadzieję, że zastosowanie kwantyla o jednym stopniu swobody zadziała.n=1
Pół kroku do naszego celu ( wykorzystanie prawego ogona )
Zanim przejdziemy do dowodu głównego twierdzenia, spójrzmy najpierw na wstępne twierdzenie, które nie jest tak silne ani satysfakcjonujące statystycznie, ale może daje dodatkowy wgląd w to, co się dzieje. Możesz przejść do dowodu głównego roszczenia poniżej, bez większych (jeśli w ogóle) strat. W tej i następnej części dowody - choć nieco subtelne - opierają się tylko na elementarnych faktach: monotoniczności prawdopodobieństw oraz symetrii i niejednoznaczności rozkładu normalnego.
Roszczenie pomocnicze : jest przedziałem ufności dla tak długo, jak . Tutaj jest kwantylem na poziomie standardowej normy.( 1 - α ) σ 2 α > 1 / 2 z α α[0,X2/z2α) (1−α) σ2 α>1/2 zα α
Dowód . iprzez symetrię, więc w poniższym przykładzie możemy przyjąć bez utraty ogólności. Teraz dla i , a więc z widzimy, że Działa to tylko dla , ponieważ jest to potrzebne dla .| σ Z + μ | d = | - σ Z + μ ||X|=|−X| |σZ+μ|=d|−σZ+μ| θ ≥ 0 μ ≥ 0 P ( | X | > θ ) ≥ P ( X > θ ) = P ( σ Z + μ > θ ) ≥ P ( Zμ≥0 θ≥0 μ≥0 θ = z α σ P ( 0 ≤ σ 2 < X 2 / z 2 α ) ≥ 1 - α
Dowodzi to roszczenia pomocniczego. Chociaż jest ilustracyjny, nie jest satysfakcjonujący ze statystycznego punktu widzenia, ponieważ do działania wymaga absurdalnie dużej .α
Potwierdzenie głównego roszczenia
Udoskonalenie powyższego argumentu prowadzi do wyniku, który będzie działał dla dowolnego poziomu zaufania. Najpierw zauważ, że Zestaw i . Następnie Jeśli możemy wykazać, że prawa strona zwiększa się dla każdego ustalonego , możemy zastosować podobny argument jak w poprzednim argumencie. Jest to co najmniej prawdopodobne, ponieważ chcielibyśmy wierzyć, że jeśli średnia wzrośnie, to bardziej prawdopodobne staje się, że zobaczymy wartość o module przekraczającyma =
Ustaw . Następnie Zauważ, że i dla dodatniego , zmniejsza się . Teraz dla łatwo zauważyć, że . Te wspólne fakty łatwo sugerują, że dla wszystkich i każdego ustalonego .fab( a ) = Φ ( a - b ) + Φ ( - a - b ) f ′ b ( 0 ) = 0 u φ ( u ) u a ∈ ( 0 , 2 b ) φ ( a - b ) ≥ φ ( - b ) = φ ( b ) f ′ b ( a ) ≥ 0 a ≥ 0 b ≥ 0
Dlatego pokazaliśmy, że dla i ,a≥0 b≥0
Rozwiązując to wszystko, jeśli weźmiemy , otrzymamy która ustanawia główne roszczenie.θ=qα−−√σ
Uwaga końcowa : uważna lektura powyższego argumentu pokazuje, że wykorzystuje on jedynie symetryczne i nieimodalne właściwości rozkładu normalnego. Stąd podejście działa analogicznie do uzyskiwania przedziałów ufności z pojedynczej obserwacji z dowolnej symetrycznej, nieimodalnej rodziny o skali lokalizacji, np. Rozkładów Cauchy'ego lub Laplace'a.
źródło
Czas na kontynuację! Oto rozwiązanie, które otrzymałem:
Przedział ufności (który jest bardzo szeroki) jest nieco konserwatywny w symulacji, bez pokrycia empirycznego (w 100 000 symulacji) poniżej 99,15%, ponieważ zmieniałem CV na wiele rzędów wielkości.
źródło
pchisq(1/4900,1,lower.tail=F)
R
0.9886
źródło