Po pierwsze, nie potrzebujemy miar prawdopodobieństwa, tylko -finiteness. Więc jest mierzalny pole i i być -finite środki o .M = ( Ω , F ) μ ν σ MσM =(Ω, F)μνσM.
Twierdzenie Radona-Nikodyma stwierdza, że jeśli dla wszystkich , oznaczonych przez , to istnieje nieujemna Borel funkcja w taki sposób,
dla wszystkich .A ∈ F μ ≫ ν f ν ( A ) = ∫ A fμ ( A ) = 0⟹ν( A ) = 0A ∈ F.μ ≫ νfaA ∈ F.
ν( A ) = ∫ZAfad μ
A ∈ F.
Oto jak lubię o tym myśleć. Po pierwsze, dla dowolnych dwóch miar na , zdefiniujmy aby oznaczać . Jest to poprawna relacja równoważności i mówimy, że i są równoważne w tym przypadku. Dlaczego jest to rozsądna równoważność środków? Miary są tylko funkcjami, ale ich domeny trudno wizualizować. Co jeśli dwie zwykłe funkcje mają tę właściwość, tj. ? Zdefiniuj
i zwróć uwagę, że w dowolnym miejscu na wsparcie μ ∼ ν μ ( A ) = 0M.μ ∼ νμ ν f , g : R → R f ( x ) = 0μ ( A ) = 0⟺ν( A ) = 0μνfa, g: R → Rh ( x ) = { f ( x ) / g ( x ) g ( x ) ≠ 0 π e o.w. g g H = f g g h = 0 ⋅ π e = 0 = f f g h g F 0 / 0 g = 0 H π efa(x)=0⟺g(x)=0
h(x)={f(x)/g(x)πeg(x)≠0ow
sol mamy , a poza obsługą (ponieważ współużytkują i ), więc pozwala przeskalować do . Jak wskazuje @whuber, kluczową ideą tutaj nie jest to, że jest w jakiś sposób „bezpieczne” do zrobienia lub zignorowania, ale raczej, gdy , nie ma znaczenia, co robi , więc możemy po prostu zdefiniować to dowolnie (jak być co nie ma tutaj specjalnego znaczenia) i rzeczy nadal działają. Również w tym przypadku możemy zdefiniować analogiczną funkcję pomocą , aby
solh = fsol solh = 0 ⋅ πmi= 0 = ffasolhsolfa0 / 0sol= 0hπmi g / f f h ′ = gh′sol/ ffah′= g .
Następnie załóżmy, że , ale drugi kierunek niekoniecznie się utrzymuje. Oznacza to, że nasza poprzednia definicja nadal działa, ale teraz nie działa, ponieważ będzie miał rzeczywiste podziały przez . Zatem możemy przeskalować do za pomocą , ale nie możemy iść w innym kierunku, ponieważ musielibyśmy przeskalować coś na coś niezerowego.h h ′ 0 g f g h = f 0sol(x ) = 0⟹fa( x ) = 0hh′0solfasolh = f0
Wróćmy teraz do i i oznaczmy nasz RND przez . Jeśli , oznacza to intuicyjnie, że można przeskalować jedno na drugie i odwrotnie. Ale generalnie chcemy iść tylko w jednym kierunku (tj. Przeskalować miłą miarę, taką jak miara Lebesgue'a, na bardziej abstrakcyjną miarę), więc potrzebujemy tylko aby zrobić użyteczne rzeczy. To przeskalowanie jest sercem RND.ν f μ ∼ ν μ ≫ νμνfaμ ∼ νμ ≫ ν
Wracając do komentarza @ whuber w komentarzach, istnieje dodatkowa subtelność, dlaczego bezpiecznie zignorować kwestię . Dzieje się tak, ponieważ przy pomocy miar zawsze definiujemy rzeczy do zbioru miary więc na każdym zestawie z możemy po prostu sprawić, aby nasz RND przyjmował dowolną wartość, powiedzmy . Więc nie jest tak, że jest iskrobezpieczne, ale raczej gdziekolwiek, gdzie mielibyśmy to zestaw miar wrt dzięki czemu możemy po prostu zdefiniować nasze RND, aby było tam coś miłego bez wpływu na nic.0 μ ( ) = 0 1 0 / 0 0 / 0 0 μ0 / 00ZAμ ( A ) = 010 / 00 / 00μ
Jako przykład załóżmy, że dla niektórych . Następnie
więc mamy to RND (można to formalnie uzasadnić twierdzeniem o zmianie miar). Jest to dobre, ponieważ dokładnie odzyskaliśmy współczynnik skalowania.k > 0 ν ( A ) = ∫ Ak ⋅ μ = νk > 0f ( x ) = k = d ν
ν( A ) = ∫ZAre ν= ∫ZAkd μ
fa( x ) = k = d νd μ
Oto drugi przykład, aby podkreślić, jak zmiana RND na zestawach miary nie ma na nie wpływu. Niech , to znaczy jest to średnia normalne PDF oraz , gdy wejście jest racjonalne i niech być RV tej gęstości. Oznacza to, że
więc w rzeczywistości jest nadal standardowym gaussowskim RV. Nie wpłynęło to w żaden sposób na zmianę na ponieważ jest to zestaw miary wrtf ( x ) = φ ( x ) + 1 Q ( x ) 1 X P ( X ∈ A ) = ∫ A ( φ + 1 Q )0fa( x ) = φ ( x ) + 1Q( x )1X= ∫ A φ
P.( X∈ A ) = ∫ZA( φ + 1Q)d λ
X X Q 0 λ= ∫ZAφd λ + λ ( Q ) = ∫ZAφd λ
XXQ0λ .
W ostatnim przykładzie, załóżmy, i i pozwolić i być odpowiednio ich dystrybucji. Przypomnijmy, że pmf jest RND w odniesieniu do miary liczenia , a ponieważ ma właściwość, że , okazuje się, że
Y ∼ Bin ( n , p ) P X P Y c c c ( A ) = 0X∼ Pois ( η)Y∼ Bin ( n , p )P.XP.Ydodod P Yc ( A ) = 0⟺A = ∅
d P.YdPX= d P.Y/ dcd P.X/ dc= fYfaX
więc możemy obliczyć
P.Y( A ) = ∫ZAd P.Y
= ∫ZAd P.Yd P.Xd P.X= ∫ZAd P.Yd P.Xd P.Xd cd c
= ∑y∈ Ad P.Yd P.X( y) d PXd c( y) =∑y∈ AfaY(y)faX(y)faX(y) = ∑y∈ AfaY(y) .
Dlatego, ponieważ dla wszystkich poparciu , możemy przeskalować całkowanie w odniesieniu do rozkładu Poissona w integrację w odniesieniu do rozkładu dwumianowego, chociaż ponieważ wszystko jest dyskretne, okazuje się, że jest trywialne wynik.P.( X= n ) > 0nY
Odniosłem się do twojego bardziej ogólnego pytania, ale nie dotknąłem rozbieżności KL. Dla mnie przynajmniej rozbieżność KL jest znacznie łatwiejsza do interpretacji pod względem testowania hipotez, takich jak odpowiedź @kjetil b halvorsen tutaj . Jeśli i istnieje miara która dominuje w obu przypadkach, wówczas użyj możemy odzyskać formę z gęstością, więc dla mnie jest to łatwiejsze.P.≪ Qμd P.d Q= d P./ dμd Q / d μ: = p / q