Funkcje Percentile Loss

11

Rozwiązanie problemu:

minmE[|mX|]

jest dobrze znana jako mediana X , ale jak wygląda funkcja utraty dla innych percentyli? Np .: 25. percentyl X jest rozwiązaniem:

minmE[L(m,X)]

Co to jest L w tym przypadku?

Cam.Davidson.Pilon
źródło

Odpowiedzi:

12

Niech funkcją wskaźnika: jest równa dla prawdziwych argumentów i przeciwnym razie. Wybierz i ustawI100<α<1

Λα(x)=αxI(x0)(1α)xI(x<0).

Postać

Ta liczba przedstawia . Wykorzystuje dokładny współczynnik kształtu, aby pomóc Ci ocenić zbocza, które po lewej stronie i po prawej stronie. W takim przypadku wycieczki powyżej są znacznie obniżone w porównaniu do wycieczek poniżej .Λ1/54/5+1/500

Jest to naturalna funkcja do wypróbowania, ponieważ waży wartości które przekraczają inaczej niż które są mniejsze niż . Obliczmy związaną z tym stratę, a następnie ją zoptymalizujmy.x0x0

Zapisywanie dla funkcji rozkładu i ustawienie , obliczFXLα(m,x)=Λα(xm)

EF(Lα(m,X))=RΛα(xm)dF(x)=αRI(xm)(xm)dF(x)(1α)R(xm)I(x<m)dF(x)=αm(xm)dF(x)(1α)m(xm)dF(x).

Rysunek 2

Ponieważ różni się na tej ilustracji standardowym rozkładem normalnym , wykreślany jest całkowity obszar ważony prawdopodobieństwem . (Krzywa jest wykresem .) Wykres po prawej stronie dla najwyraźniej pokazuje efekt zmniejszenia wartości dodatnich, ponieważ bez tego zmniejszenia wykresu być symetrycznym względem pochodzenia. Środkowy wykres pokazuje optymalne, gdzie całkowita ilość niebieskiego atramentu (reprezentująca ) jest tak mała, jak to możliwe.mFΛ1/5Λ1/5(xm)dF(x)m=0EF(L1/5(m,X)) 

Funkcję tę można rozróżnić, dlatego jej ekstrema można znaleźć, sprawdzając punkty krytyczne. Zastosowanie reguły łańcuchowej i podstawowego twierdzenia rachunku różniczkowego i całkowego w celu uzyskania pochodnej względem dajem

mEF(Lα(m,X))=α(0mdF(x))(1α)(0mdF(x))=F(m)α.

Dla rozkładu ciągłych to zawsze ma rozwiązanie, , który z definicji jest dowolnym kwantylem . Dla rozkładu nieciągłych to może nie posiada rozwiązania, ale będzie co najmniej jeden , dla których dla wszystkich i dla wszystkich : jest również (z definicji) jest kwantylem .mαXmF(x)α<0x<mF(x)α0xmαX

Wreszcie, ponieważ i , jasne jest, że ani ani nie zminimalizują tej straty. To wyczerpuje kontrolę punktów krytycznych, pokazując, że pasuje do rachunku.α0α1mmΛα

W szczególnym przypadku to strata wykazana w pytanie.EF(2L1/2(m,X))=EF(|mx|)

Whuber
źródło
Doceniam wysiłek włożony w wykazanie oczekiwanej straty minimalizowany przez właściwy punkt . Zastanawiałem się, jak to zrobić dla własnej odpowiedzi, ale twoje wyjaśnienie jest dobre. (+1)m
2
Udowodniłeś, że zdjęcia są warte 1000 słów. Dzięki @whuber =)
Cam.Davidson.Pilon
8

W tym artykule znajdziesz odpowiedź. Aby być konkretnym, Funkcję strat można interpretować jako „równoważenie” różnych obszarów masy prawdopodobieństwa około poprzez odjęcie . Dla mediany te obszary masy są równe: czyniąc funkcję straty proporcjonalną (w oczekiwaniu stałej jest pomijalna) do co daje pożądany wniosek dla mediany.

L0.25(m,X)=|(Xm)(0.251{X>m})|.
0.250.251{X>m}
L0.5(m,X)=|(Xm)(0.51{X>m})|=|(Xm)×±0.5|,
|Xm|,

źródło
(+1) Dobra robota! - nie było oczywiste, gdzie szukać tego artykułu z Wikipedii; musiałeś pomyśleć o regresji kwantowej.
whuber
Dzięki, @Matthew, to świetne znalezisko. Lubię wyważać interpretację
Cam.Davidson.Pilon
Nadal nie rozumiem. Skąd to pochodzi? Jeśli X jest powyżej kwantyla, jest ważony 0,75, w przeciwnym razie 0,25? Po prostu to? |(0.25)1X>m)|(Xm)
IcannotFixTen