Rozumiem to pytanie jako prośbę o wgląd w to, jak można wymyślić jakąkolwiek funkcję straty, która produkuje dany kwantyl jako minimalizator strat, bez względu na to, jaki może być podstawowy rozkład. Byłoby zatem niezadowalające powtórzenie analizy w Wikipedii lub gdzie indziej, która pokazuje, że ta konkretna funkcja strat działa.
Zacznijmy od czegoś znajomego i prostego.
Co mówisz jest znalezienie „Location” w stosunku do dystrybucji lub zestawu danych . Dobrze wiadomo na przykład, że średnia minimalizuje oczekiwany kwadrat resztkowy; to jest wartość, dla którejx∗Fx¯
LF(x¯)=∫R(x−x¯)2dF(x)
jest tak mały, jak to możliwe. Użyłem tego zapisu, aby przypomnieć nam, że jest pochodną straty , że jest określana przez , ale co najważniejsze, zależy od liczby .LFx¯
Standardowy sposób pokazania, że minimalizuje dowolną funkcję, zaczyna się od wykazania, że wartość funkcji nie zmniejsza się, gdy zostanie nieco zmieniona. Taka wartość nazywana jest punktem krytycznym funkcji.x∗x∗
Jaki rodzaj funkcji straty spowodowałby, że percentyl byłby punktem krytycznym? Strata dla tej wartości byłabyΛF−1(α)
LF(F−1(α))=∫RΛ(x−F−1(α))dF(x)=∫10Λ(F−1(u)−F−1(α))du.
Aby był to punkt krytyczny, jego pochodna musi wynosić zero. Ponieważ my po prostu staramy się znaleźć jakieś rozwiązanie, nie zatrzyma, aby zobaczyć, czy manipulacje są uzasadnione: będziemy planować, aby sprawdzić dane techniczne (takie jak to, czy naprawdę możemy odróżnić , itd ) na końcu. A zatemΛ
0=L′F(x∗)=L′F(F−1(α))=−∫10Λ′(F−1(u)−F−1(α))du=−∫α0Λ′(F−1(u)−F−1(α))du−∫1αΛ′(F−1(u)−F−1(α))du.(1)
Po lewej stronie argument jest negatywny, a po prawej jest pozytywny. Poza tym mamy niewielką kontrolę nad wartościami tych całek, ponieważ może być dowolną funkcją rozkładu. W związku z tym naszą jedyną nadzieją jest uzależnienie tylko od znaku jego argumentu, w przeciwnym razie musi być stała.ΛFΛ′
Oznacza to, że będzie fragmentarycznie liniowa, potencjalnie z różnymi nachyleniami na lewo i prawo od zera. Oczywiście powinno się zmniejszać w miarę zbliżania się do zera - w końcu jest to strata, a nie zysk . Co więcej, przeskalowanie o stałą nie zmieni jej właściwości, więc możemy swobodnie ustawić nachylenie lewej ręki na . Niech będzie nachyleniem po prawej stronie. Następnie upraszcza sięΛΛ−1τ>0(1)
0=α−τ(1−α),
whence the unique solution is, up to a positive multiple,
Λ(x)={−x, x≤0α1−αx, x≥0.
Multiplying this (natural) solution by 1−α, to clear the denominator, produces the loss function presented in the question.
Clearly all our manipulations are mathematically legitimate when Λ has this form.