Przedział ufności dla wariancji przy jednej obserwacji

25

Jest to problem z „7 Olimpiady Kołmogorowskiej w teorii prawdopodobieństwa”:

Biorąc pod uwagę jedno spostrzeżenie z rozkładu nazwa z oboma parametrami nieznanymi, podaj przedział ufności dla z poziomem ufności co najmniej 99%.Normalna ( μ , σ 2 ) σ 2XNormal(μ,σ2)σ2)

Wydaje mi się, że powinno to być niemożliwe. Mam rozwiązanie, ale jeszcze go nie przeczytałem. jakieś pomysły?

Wyślę rozwiązanie za kilka dni.

[Edycja uzupełniająca: oficjalne rozwiązanie opublikowane poniżej. Rozwiązanie kardynała jest dłuższe, ale daje lepszy przedział ufności. Dziękujemy również Maxowi i Glen_b za ich wkład.]

Jonathan Christensen
źródło
1
Wydaje mi się również niemożliwe; Czekam na odpowiedź
Peter Flom - Przywróć Monikę
1
Sprawdź tę stronę .
zakładano, że nie występuje w
3
Oto artykuł z lepszym formatowaniem: papier .
zakłada się, że nie występuje w
Heh Pamiętam, jak czytałem artykuł na ten temat (jeden interwał obserwacji) wiele lat temu. Może to był ten .
Glen_b
1
@Max, dzięki za link! Nie miałem jeszcze czasu, żeby się temu przyjrzeć, ale zrobię to. Poniżej opublikowałem „oficjalną” odpowiedź.
Jonathan Christensen,

Odpowiedzi:

17

Patrząc przez pryzmat prawdopodobieństwa nierówności i powiązań z przypadkiem wielokrotnej obserwacji, wynik ten może nie wydawać się tak niemożliwy, a przynajmniej bardziej prawdopodobny.

Niech z i nieznane. Możemy napisać dla .μ σ 2 X = σ Z + μ Z N ( 0 , 1 )XN(μ,σ2)μσ2X=σZ+μZN(0,1)

Główne zastrzeżenie : to przedział ufności dla gdzie jest kwantylem na poziomie rozkładu chi-kwadrat z jednym stopniem wolność. Ponadto, ponieważ interwał dokładnie pokrycia podczas , to jest najwęższa możliwa odstęp postaci do pewnego .( 1 - α ) σ 2 q α α ( 1 - α ) μ = 0 [ 0 , b X 2 ) b R[0,X2/qα)(1α)σ2qαα (1-α)μ=0[0,bX2))bR

Powód do optymizmu

Przypomnijmy, że w przypadku , gdy , typowy przedział ufności dla wynosi gdzie jest poziomowym kwantylem chi-kwadrat z stopni swobody. Dotyczy to oczywiście każdego . Chociaż jest to najbardziej popularny przedział (z oczywistych powodów nazywany interwałem o jednakowym ogonie ), nie jest to ani jedyny, ani nawet najmniejszy! Jak powinno być oczywiste, kolejnym ważnym wyborem jest T = n i = 1 ( X i - ˉ X ) 2 ( 1 - α ) σ 2 ( Tn2)T.=ja=1n(Xja-X¯)2) (1-α)σ2)q k , a a k μ ( 0 , T

(Tqn1,(1α)/2,Tqn1,α/2),
qk,aakμ
(0,Tqn1,α).

Ponieważ , a następnie ma również zasięg co najmniej . ( 0 , n i = 1 X 2 iTi=1nXi2( 1 - α )

(0,i=1nXi2qn1,α),
(1α)

Patrząc w tym świetle, możemy być optymistami, że przedział w głównym twierdzeniu jest prawdziwy dla . Główna różnica polega na tym, że w przypadku pojedynczej obserwacji nie ma rozkładu chi-kwadrat o zerowym stopniu swobody, więc musimy mieć nadzieję, że zastosowanie kwantyla o jednym stopniu swobody zadziała.n=1

Pół kroku do naszego celu ( wykorzystanie prawego ogona )

Zanim przejdziemy do dowodu głównego twierdzenia, spójrzmy najpierw na wstępne twierdzenie, które nie jest tak silne ani satysfakcjonujące statystycznie, ale może daje dodatkowy wgląd w to, co się dzieje. Możesz przejść do dowodu głównego roszczenia poniżej, bez większych (jeśli w ogóle) strat. W tej i następnej części dowody - choć nieco subtelne - opierają się tylko na elementarnych faktach: monotoniczności prawdopodobieństw oraz symetrii i niejednoznaczności rozkładu normalnego.

Roszczenie pomocnicze : jest przedziałem ufności dla tak długo, jak . Tutaj jest kwantylem na poziomie standardowej normy.( 1 - α ) σ 2 α > 1 / 2 z α α[0,X2/zα2)(1α)σ2α>1/2zαα

Dowód . iprzez symetrię, więc w poniższym przykładzie możemy przyjąć bez utraty ogólności. Teraz dla i , a więc z widzimy, że Działa to tylko dla , ponieważ jest to potrzebne dla .| σ Z + μ | d = | - σ Z + μ ||X|=|X||σZ+μ|=d|σZ+μ|θ 0 μ 0 P ( | X | > θ ) P ( X > θ ) = P ( σ Z + μ > θ ) P ( Zμ0θ0μ0θ = z α σ P ( 0 σ 2 < X 2 / z 2 α ) 1 - α

P(|X|>θ)P(X>θ)=P(σZ+μ>θ)P(Z>θ/σ),
θ=zασα > 1 / 2 z α > 0
P(0σ2<X2/zα2)1α.
α>1/2)zα>0

Dowodzi to roszczenia pomocniczego. Chociaż jest ilustracyjny, nie jest satysfakcjonujący ze statystycznego punktu widzenia, ponieważ do działania wymaga absurdalnie dużej .α

Potwierdzenie głównego roszczenia

Udoskonalenie powyższego argumentu prowadzi do wyniku, który będzie działał dla dowolnego poziomu zaufania. Najpierw zauważ, że Zestaw i . Następnie Jeśli możemy wykazać, że prawa strona zwiększa się dla każdego ustalonego , możemy zastosować podobny argument jak w poprzednim argumencie. Jest to co najmniej prawdopodobne, ponieważ chcielibyśmy wierzyć, że jeśli średnia wzrośnie, to bardziej prawdopodobne staje się, że zobaczymy wartość o module przekraczającyma =

P.(|X|>θ)=P.(|Z+μ/σ|>θ/σ).
b = θ / σ 0 P ( | Z + a | > b ) = Φ ( a - b ) + Φ ( - a - b )za=μ/σ0b=θ/σ0a b b
P.(|Z+za|>b)=Φ(za-b)+Φ(-za-b).
zabb. (Musimy jednak uważać na to, jak szybko masa maleje w lewym ogonie!)

Ustaw . Następnie Zauważ, że i dla dodatniego , zmniejsza się . Teraz dla łatwo zauważyć, że . Te wspólne fakty łatwo sugerują, że dla wszystkich i każdego ustalonego .fab(za)=Φ(za-b)+Φ(-za-b)f b ( 0 ) = 0 u φ ( u ) u a ( 0 , 2 b ) φ ( a - b ) φ ( - b ) = φ ( b ) f b ( a ) 0 a 0 b 0

fb(a)=φ(ab)φ(ab)=φ(ab)φ(za+b).
fab(0)=0uφ(u)uza(0,2)b)φ(ab)φ(b)=φ(b)
fb(a)0
a0b0

Dlatego pokazaliśmy, że dla i , a0b0

P(|Z+a|>b)P(|Z|>b)=2Φ(b).

Rozwiązując to wszystko, jeśli weźmiemy , otrzymamy która ustanawia główne roszczenie.θ=qασ

P(X2>qασ2))P.(Z2)>qα)=1-α,

Uwaga końcowa : uważna lektura powyższego argumentu pokazuje, że wykorzystuje on jedynie symetryczne i nieimodalne właściwości rozkładu normalnego. Stąd podejście działa analogicznie do uzyskiwania przedziałów ufności z pojedynczej obserwacji z dowolnej symetrycznej, nieimodalnej rodziny o skali lokalizacji, np. Rozkładów Cauchy'ego lub Laplace'a.

kardynał
źródło
Łał! i oczekuje się, że studenci przedstawią tego rodzaju argumenty w krótkim czasie egzaminu z Olimpiady?
Dilip Sarwate,
1
@Dilip: Nie mam pojęcia! Nie jestem zaznajomiony z formatem tej olimpiady ani z oczekiwanymi rozwiązaniami. Z dosłownego odczytania pomyślałbym, że odpowiedź Scortchi byłaby do przyjęcia. Bardziej zainteresowałem się próbą ustalenia, jak daleko można się posunąć dzięki „nietrywialnemu” rozwiązaniu. Moja (dość minimalna) eksploracja przebiegała zgodnie z tym samym tokiem myślenia opisanym w odpowiedzi (z jednym objazdem). Jest całkiem prawdopodobne, że istnieje lepsze rozwiązanie. :-)
kardynał
Jest to znacznie dłużej niż „oficjalne” rozwiązanie, ale lepiej wiąże wariancję, więc zaznaczam ją jako „poprawną” odpowiedź. Poniżej opublikowałem „oficjalną” odpowiedź, a także wyniki symulacji i dyskusję. Dzięki, @cardinal!
Jonathan Christensen,
2
@Jathanathan: Dzięki. Tak, mogłem uczynić dowód nieco bardziej zwięzłym. Ze względu na szeroką gamę tła uczestników tutaj często oddaję się dodatkowym (lub być może nadmiernym) szczegółom. :-)
kardynał
12

Czas na kontynuację! Oto rozwiązanie, które otrzymałem:

[0,T.(X))T.()

(μR)(σ>0)P.μ,σ2)(σ2)>T.(X))<0,01.
N.(μ,σ2))1/σ2)πP.(|X|za)za/σza0
tP.(|X|/σt)=P.(X2)t2)σ2))=P.(σ2)X2)/t2)).
t=0,01T.(X)=10000X2).

Przedział ufności (który jest bardzo szeroki) jest nieco konserwatywny w symulacji, bez pokrycia empirycznego (w 100 000 symulacji) poniżej 99,15%, ponieważ zmieniałem CV na wiele rzędów wielkości.

6300X2)10000X2)

(0,4900X2))

Jonathan Christensen
źródło
1
tt
2
P.(|X|za)2)za/σ2)π(0,2)X2)/πα2))αα=0,01T.(X)6366,198X2)1/q0,016365.864α
1
(0,4900X2))(0,bX2))bμ=0X2)/σ2)bb=1/qα. Innymi słowy, interwał podany w mojej odpowiedzi jest najwęższym z podanych formularzy.
kardynał
1
pchisq(1/4900,1,lower.tail=F)R0.9886(0,4900X2))
1
Dzięki za wszystkie komentarze, @cardinal. Myślę, że twoja zmiana jest poprawna, chociaż wpisałem ją tak, jak było w oryginalnych rozwiązaniach - chyba literówka.
Jonathan Christensen
5

(0,)

Scortchi - Przywróć Monikę
źródło
1
Myślę, że byłoby pomocne, gdybyś powiedział, dlaczego nie możesz uzyskać przedziału ufności o skończonej długości.
przyjęto, że nie występuje w
1
@Max Nie jestem wystarczająco bystry - ale pytanie nie wymagało jednego.
Scortchi - Przywróć Monikę
4
+1 za to. Pytanie nie mówiło o CI z minimalnym zakresem, a w rzeczywistości sugeruje, że można to zaakceptować dzięki jego ciekawemu sformułowaniu „przedział ufności z poziomem ufności co najmniej 99%”.
Ari B. Friedman,