Jeśli jest funkcją wypukłą, to nierówność Jensena stwierdza, że i mutatis mutandis, gdy jest wklęsłe. Oczywiście w najgorszym przypadku nie można górnej granicy w kategoriach dla wypukłego , ale czy istnieje granica, która idzie w tym kierunku, jeśli jest wypukły, ale „niezbyt wypukły”? Czy istnieje jakieś standardowe ograniczenie, które określa warunki dla funkcji wypukłej (i ewentualnie także rozkład, jeśli to konieczne), które pozwoliłyby wyciągnąć wniosek, że , gdzief ( E [ x ] ) ≤ E [ f ( x ) ] f E [ f ( x ) ] f ( E [ x ] ) f f f E [ f ( x ) ] ≤ φ ( f ) f ( E [ x ] ) φ ( f ) fjest jakąś funkcją krzywizny / stopnia wypukłości ? Może coś podobnego do stanu Lipschitza?
21
Odpowiedzi:
EDYCJA: w oryginalnej wersji brakowało wartości bezwzględnej. Przepraszam!!
Cześć Ian. Pokrótce przedstawię dwie przykładowe nierówności, jedną przy użyciu wiązania Lipschitza, drugą przy użyciu wiązania na drugiej pochodnej, a następnie omówię pewne trudności w tym problemie. Chociaż jestem zbędny, ponieważ podejście wykorzystujące jedną pochodną wyjaśnia, co dzieje się z większą liczbą pochodnych (przez Taylora), okazuje się, że druga wersja pochodnej jest całkiem niezła.
Po pierwsze, związane z Lipschitzem: po prostu przerób standardową nierówność Jensena. Ta sama sztuczka dotyczy: oblicz ekspansję Taylora na oczekiwanej wartości.
W szczególności Niech ma odpowiednią miarę μ i ustaw m : = E ( x ) . Jeśli f ma stałą L Lipschitza , to według twierdzenia TayloraX μ m : = E ( x ) fa L.
gdzie (Uwaga: x ≤ m i x > m jest możliwe). Używając tego i ponownie pracując nad dowodem Jensena (jestem paranoikiem i sprawdziłem, czy ten standardowy rzeczywiście jest na wikipedii),z∈[m,x] x≤m x > m
Załóżmy teraz . W tym przypadku,|f′′(x)|≤λ
a więc
Chciałbym krótko wspomnieć o kilku rzeczach. Przepraszam, jeśli są oczywiste.
Jest to, że nie można po prostu powiedzenia „wlog ” przez przesuwanie rozkładu, ponieważ zmienia się zależność między i .f μE(X)=0 f μ
Następnie granica musi w jakiś sposób zależeć od dystrybucji. W tym celu patrz wyobrazić, że i . Niezależnie od wartości , nadal otrzymujesz . Z drugiej strony . Tak więc, zmieniając , możesz uczynić odstęp między dwiema wielkościami dowolnymi! Intuicyjnie większa masa jest wypychana ze średniej, a zatem dla każdej ściśle wypukłej funkcji nazwa wzrośnie.f ( x ) = x 2 σ f ( E ( X ) ) = f ( 0 ) = 0 E ( f ( X ) ) = E ( X 2 ) = σ 2 σ E ( f ( X ) )X∼Gaussian(0,σ2) f(x)=x2 σ f(E(X))=f(0)=0 E(f(X))=E(X2)=σ2 σ E(f(X) )
Wreszcie nie widzę, jak uzyskać mnożenie, jak sugerujesz. Wszystko, czego użyłem w tym poście, jest standardowe: twierdzenie Taylora i granice pochodnych są chlebem i masłem w granicach statystyki i automatycznie dają błędy addytywne, a nie mnożące.
Zastanowię się jednak i opublikuję coś. Nieokreślona intuicja mówi, że będzie wymagała bardzo uciążliwych warunków zarówno dla funkcji, jak i rozkładu, i że granica addytywna jest w istocie jej sednem.
źródło
Aby uzyskać wgląd, rozważ rozkład skoncentrowany na dwóch wartościach; powiedzmy, z jednakowymi prawdopodobieństwami 1/2, że wynosi 1 lub 3, skąd . Take N > > 0 i ε > 0 . Rozważ funkcje f, dla których f ( 1 ) = f ( 3 ) = N ϵ i f ( E [ x ] ) = f ( 2 ) = ϵ . RobiącE[x]=2 N>>0 ϵ>0 f f(1)=f(3)=Nϵ f(E[x])=f(2)=ϵ wystarczająco małe iciągłełączenie f pomiędzy tymi trzema punktami możemy sprawić, że krzywizna f będzie tak mała, jak to pożądane. Następnieϵ f f
jeszczeE[f(x)]=Nϵ
.N=Nϵ/ϵ=E[f(x)]/f(E[x])≤φ(f)
To pokazuje, że musi być dowolnie duże.φ(f)
źródło