Twierdzenie Halmosa-Savage'a mówi, że dla dominującego modelu statystycznego statystyka jest wystarczający, jeśli (i tylko jeśli) dla wszystkich istnieje wersja pochodnej Radon Nikodym, mierzalna wersja gdzie jest uprzywilejowany środek taki, że do i .
Próbowałem zrozumieć intuicyjnie, dlaczego to twierdzenie jest prawdziwe, ale nie udało mi się, więc moje pytanie brzmi, czy istnieje intuicyjny sposób zrozumienia tego twierdzenia.
Odpowiedzi:
Techniczny lemat
Nie jestem pewien, czy jest to intuicyjne, ale główny wynik techniczny leżący u podstaw twierdzenia Halmosa-Savage'a jest następujący:
Zostało to zaczerpnięte dosłownie z Twierdzenia A.78 w Schervish's Theory of Statistics (1995) . W tym miejscu przypisuje to Lehmannnowi Testing Statistics Hypotheses (1986) ( link do trzeciej edycji ), w której wynik przypisuje się Halmosowi i Savage'owi (patrz Lemat 7). Innym dobrym odniesieniem są statystyki matematyczne Shao (drugie wydanie, 2003) , gdzie odpowiednie wyniki to Lemma 2.1 i Twierdzenie 2.2.
Powyższy lemat mówi, że jeśli zaczniesz od rodziny miar zdominowanych przez skończoną miarę, to tak naprawdę możesz zastąpić dominującą miarę przez policzalną wypukłą kombinację miar z rodziny. Schervish pisze przed stwierdzeniem Twierdzenia A.78,σ
Konkretny przykład
Załóżmy, że dokonujemy pomiaru wielkości która naszym zdaniem jest równomiernie rozłożona w przedziale dla niektórych nieznanych . W tym problemie statystycznym domyślnie bierzemy pod uwagę zbiór miar prawdopodobieństwa Borela na składający się z równomiernych rozkładów we wszystkich przedziałach postaci . Oznacza to, że jeśli oznacza miarę Lebesgue'a, a dla , oznacza rozkład (tj.X [0,θ] θ>0 P R [0,θ] λ θ>0 Pθ Uniform([0,θ]) Pθ(A)=1θλ(A∩[0,θ])=∫A1θ1[0,θ](x)dx
dla każdego Borel ), wtedy mamy po prostu
Jest to zbiór rozkładów kandydujących do naszego pomiaru .A⊆R P={Pθ:θ>0}. X
Rodzina jest wyraźnie zdominowana przez miarę Lebesgue'a (która jest -finite), więc powyższy lemat (z ) gwarantuje istnienie sekwencji liczb nieujemnych sumujących się do i sekwencja rozkładów jednolitych w takich, że dla każdego . W tym przykładzie możemy jawnie skonstruować takie sekwencje!P λ σ ℵ=P {ci}∞i=1 1 {Qi}∞i=1 P Pθ≪∑i=1∞ciQi θ>0
Po pierwsze, niech będzie wyliczeniem dodatnich liczb wymiernych ( można to zrobić jawnie ) i niech dla każdego . Następnie pozwól , aby . Twierdzę, że ta kombinacja i działa.(θi)∞i=1 Q i = P θ i i c i = 2 - i ∑ ∞ i = 1 c i = 1 { c i } ∞ i = 1 { Q i } ∞ i = 1Qi=Pθi i ci=2−i ∑∞i=1ci=1 {ci}∞i=1 {Qi}∞i=1
Aby to zobaczyć, napraw i pozwól, aby był podzbiorem Borela tak aby . Musimy pokazać, że . Ponieważ i każdy zbiór jest nieujemny, wynika z tego, że dla każdego . Ponadto, ponieważ każdy jest dodatni, wynika z tego, że dla każdego . Oznacza to, że dla wszystkich mamy Ponieważ każdyθ>0 A R ∑∞i=1ciQi(A)=0 Pθ(A)=0 ∑∞i=1ciQi(A)=0 ciQi(A)=0 i ci Qi(A)=0 i i Qi(A)=Pθi(A)=1θiλ(A∩[0,θi])=0. θi jest dodatni, wynika z tego, że dla każdego .λ(A∩[0,θi])=0 i
Teraz wybierz podciąg z który zbiegnie się do z góry (można to zrobić ponieważ jest gęsty w ). Następnie jako , więc na podstawie ciągłości pomiaru dochodzimy do wniosku, że a więc . To potwierdza roszczenie.{θik}∞k=1 {θi}∞i=1 θ Q R A∩[0,θθik]↓A∩[0,θ] k→∞ λ(A∩[0,θ])=limk→∞λ(A∩[0,θik])=0, Pθ(A)=0
Tak więc w tym przykładzie byliśmy w stanie wyraźnie skonstruować policzalną wypukłą kombinację miar prawdopodobieństwa z naszej zdominowanej rodziny, która wciąż dominuje całą rodzinę. Powyższy lemat gwarantuje, że można to zrobić dla każdej zdominowanej rodziny (przynajmniej tak długo, jak długo dominującą miarą jest -finite).σ
Twierdzenie Halmosa-Savage'a
Przejdźmy teraz do twierdzenia Halmosa-Savage'a (dla którego użyję nieco innej notacji niż w pytaniu ze względu na osobiste preferencje). Biorąc pod uwagę twierdzenie Halmosa-Savage'a, twierdzenie faktoryzacji Fishera-Neymana jest tylko jednym zastosowaniem lematu Dooba-Dynkina i reguły łańcucha pochodnych Radon-Nikodym!
Dowód. Powyższym lematem możemy natychmiast zastąpić przez dla jakiejś sekwencji liczb nieujemnych i sekwencja miar prawdopodobieństwa w .μ P∗=∑∞i=1ciPi {ci}∞i=1 ∑∞i=1ci=1 {Pi}∞i=1 P
(1. implikuje 2.) Załóżmy, że jest wystarczający. Następnie musimy pokazać, że istnieją wersje dp dla wszystkich . Niech będzie jądrem prawdopodobieństwa w twierdzeniu twierdzenia. Dla każdego i mamy Zatem jest wersją dla wszystkich .T T dP/dP∗ P∈P r A∈σ(T) B∈B P∗(A∩B)=∑i=1∞ciPi(A∩B)=∑i=1∞ci∫APi(B∣T)dPi=∑i=1∞ci∫Ar(B,T)dPi=∫Ar(B,T)dP∗. r(B,T) P∗(B∣T) B∈B
Dla każdego , niech oznacza wersję pochodnej Radon-Nikodym na mierzalnej przestrzeni (więc w szczególności jest mierzalny). Następnie dla wszystkich i mamy Tak więc w rzeczywistości jestP∈P fP dP/dP∗ (X,σ(T)) fP T B∈B P∈P P(B)=∫XP(B∣T)dP=∫Xr(B,T)dP=∫Xr(B,T)fPdP∗=∫XP∗(B∣T)fPdP∗=∫XEP∗[1BfP∣T]dP∗=∫BfPdP∗. fP T -mierzalna wersja na . Dowodzi to, że pierwszy warunek twierdzenia implikuje drugi.dP/dP∗ (X,B)
(2. implikuje 1.) Załóżmy, że dla każdego można wybrać wersję dla f_P . Dla każdego niech oznacza określoną wersję (np. jest funkcją taką, że to wersja ). Ponieważ jest standardową przestrzenią Borela, możemy wybrać w sposób, który czyni ją jądrem prawdopodobieństwa (patrz np. Twierdzenie B.32 w Teorii statystyki Schervisha (1995)). Pokażemy, żeT fP dP/dP∗ P∈P B∈B r(B,t) P∗(B∣T=t) r(B,t) r(B,T) P∗(B∣T) (T,C) r r(B,T) jest wersją dla dowolnego i dowolnego . Tak więc niech i . Następnie dla wszystkich mamy
To pokazuje, że jest wersją dla dowolnego i dowolnego , a dowodem jest gotowy.P(B∣T) P∈P B∈B A∈σ(T) B∈B P∈P P(A∩B)=∫A1BfPdP∗=∫AEP∗[1BfP∣T]dP∗=∫AP∗(B∣T)fPdP∗=∫Ar(B,T)fPdP∗=∫Ar(B,T)dP. r(B,T) P(B∣T) P∈P B∈B
źródło