Jeśli jest rozkładem prawdopodobieństwa z niezerowymi wartościami na , dla jakiego typu (typów) istnieje stała taka, że dla wszystkich ?
Powyższa nierówność jest w rzeczywistości rozbieżnością Kullbacka-Leiblera między rozkładem a jego skompresowaną wersją . Dowiedziałem się, że ta nierówność dotyczy rozkładów wykładniczych, gamma i Weibulla i jestem ciekawy, czy to działa dla większej klasy rozkładów prawdopodobieństwa.( 1 + ϵ ) p ( x ( 1 + ϵ ) )
Masz pojęcie, co oznacza ta nierówność?
Odpowiedzi:
Czynności wstępne
pisać
Logarytmy i związek między i sugerują wyrażanie zarówno jak i jego argumentu jako wykładników. W tym celu zdefiniujp(x) p(x(1+ϵ)) p
dla wszystkich rzeczywistych dla których zdefiniowano prawą stronę i są równe gdziekolwiek . Zauważ, że zmiana zmiennych pociąga za sobą i (przyjmując za gęstość rozkładu), że prawo prawdopodobieństwa całkowitego można w ten sposób wyrazić jakoy −∞ p(ey)=0 x=ey dx=eydy p
Załóżmy gdy .eq(y)+y→0 y→±∞ Wyklucza to rozkłady prawdopodobieństwa z nieskończenie wieloma skokami gęstości w pobliżu lub . W szczególności, jeśli ogony są ostatecznie monotoniczne, implikuje to założenie, pokazując, że nie jest ono poważne.p 0 ∞ p (1)
Aby ułatwić pracę z logarytmami, również to zauważ
Ponieważ następujące obliczenia zostaną wykonane do wielokrotności , zdefiniujϵ2
Równie dobrze możemy zastąpić przez , z odpowiadającym i dodatnią odpowiadającą dodatniej .1+ϵ eδ δ=0 ϵ=0 δ ϵ
Analiza
Jednym oczywistym sposobem, w jaki nierówność może się nie powieść, byłoby całki na część . Stałoby się tak, gdyby na przykład istniała dowolny właściwy przedział liczb dodatnich, bez względu na to, jak mały, w którym były identycznie zerowe, ale nie były zerowe w przedziale . nieskończone z prawdopodobieństwem dodatnim.Ip(ϵ) ϵ∈(0,1] [u,v] p p [u−ϵ,v−ϵ]
Ponieważ pytanie jest nieokreślone dotyczące natury , moglibyśmy ugrzęznąć w kwestiach technicznych dotyczących tego, jak gładkie może być . Unikajmy takich problemów, wciąż mając nadzieję na uzyskanie wglądu, zakładając, że wszędzie ma tyle pochodnych, ile chcielibyśmy użyć. (Dwa będą wystarczające, jeśli jest ciągłe.) Ponieważ to gwarantuje, że pozostaje ograniczone w każdym ograniczonym zestawie, oznacza to, że nigdy nie jest równe zero, gdy .p p q q′′ q p(x) x>0
Zauważ, że pytanie naprawdę dotyczy zachowania gdy zbliża się do zera z góry. Ponieważ ta całka jest funkcją ciągłą w przedziale , osiąga pewne maksymalne gdy jest ograniczone do dowolnego przedziału dodatniego , co pozwala nam wybrać , ponieważ oczywiścieIp(ϵ) ϵ ϵ (0,1] Mp(a) ϵ [a,1] c=Mp(a)/a2
sprawia, że nierówność działa. Właśnie dlatego musimy zajmować się tylko obliczeniami modulo .ϵ2
Rozwiązanie
Korzystając ze zmian zmiennej z na , z na i na , obliczmy w drugim rzędzie w (lub ) w nadziei na osiągnięcie uproszczenie. W tym celu zdefiniujx y p q ϵ δ Ip(ϵ) ϵ δ
być rzędem - pozostałe w rozwinięciu Taylora wokół .2 q y
Zmiana zmiennych na w całce lewej ręki pokazuje, że musi zniknąć, jak zauważono w założeniu po . Zmiana zmiennych z powrotem na w całce z prawej strony dajeq(y)+y (1) x=ey
Nierówność ma miejsce (według naszych różnych technicznych założeń) wtedy i tylko wtedy, gdy współczynnik po prawej stronie jest skończony.δ2
Interpretacja
To dobry moment, aby przestać, ponieważ wydaje się, że odkrywa on zasadniczy problem: jest ograniczony kwadratową funkcją właśnie wtedy, gdy błąd kwadratowy w rozszerzeniu Taylora nie eksploduje (względem rozkładu), gdy zbliża się do .Ip(ϵ) ϵ q y ±∞
Sprawdźmy niektóre przypadki wymienione w pytaniu: rozkłady wykładnicze i gamma. (Wykładniczy jest szczególnym przypadkiem gammy.) Nigdy nie musimy się martwić parametrami skali, ponieważ zmieniają jedynie jednostki miary. Liczą się tylko parametry nieskalowane.
Tutaj, ponieważ dla , Rozwinięcie Taylora wokół dowolnego jestTwierdzenie Taylora z Remainderem sugeruje, że jest zdominowany przez dla wystarczająco małego . Ponieważ oczekiwanie na jest skończone, nierówność obowiązuje dla rozkładów gamma.p(x)=xke−x k>−1
Podobne obliczenia sugerują nierówność dla rozkładów Weibulla, rozkładów półnormalnych, rozkładów lognormalnych itp. W rzeczywistości, aby uzyskać kontrprzykłady, musielibyśmy naruszyć co najmniej jedno założenie, zmuszając nas do spojrzenia na rozkłady, w których znika w pewnym przedziale lub nie podlega ciągłej dwukrotnej różniczkowalności lub ma nieskończenie wiele trybów. Są to łatwe testy do zastosowania do dowolnej rodziny rozkładów powszechnie stosowanych w modelowaniu statystycznym.p
źródło