Czytam o funkcji kwantylu, ale nie jest to dla mnie jasne. Czy możesz podać bardziej intuicyjne wyjaśnienie niż podane poniżej?
Ponieważ cdf jest monotonicznie rosnącą funkcją, ma odwrotność; oznaczmy to przez . Jeśli jest cdf , to jest wartością tak że P (X \ le x_ \ alpha) = \ alpha ; nazywa się to \ alfa kwantyl F . Wartość F ^ {- 1} (0,5) jest medianą rozkładu, z połową masy prawdopodobieństwa po lewej, a połową po prawej. Wartości F ^ {- 1} (0,25) i F ^ {- 1} (0,75) to dolny i górny kwartyl.F - 1 F X F - 1 ( α ) x α P ( X ≤ x α ) = α α F F - 1 ( 0,5 ) F - 1 ( 0,25 ) F - 1 ( 0,75 )
distributions
cdf
inverse-cdf
quantile-function
Inder Gill
źródło
źródło
Odpowiedzi:
Na początku wszystko to może wydawać się skomplikowane, ale zasadniczo dotyczy czegoś bardzo prostego.
Przez funkcję rozkładu skumulowanego oznaczamy funkcję, która zwraca prawdopodobieństwa, że będzie mniejsze lub równe pewnej wartości ,X x
Ta funkcja przyjmuje jako dane wejściowe i zwraca wartości z przedziału (prawdopodobieństwa) --let oznacza je jako . Odwrotność funkcji dystrybuanty (lub odwrotna dystrybuanta) mówi, co stałaby zwraca jakąś wartość ,x [0,1] p x F ( x ) px F(x) p
Jest to zilustrowane na poniższym schemacie, który wykorzystuje jako przykład normalną funkcję rozkładu skumulowanego (i jej odwrotność).
Przykład
Jako prosty przykład możesz wziąć standardową dystrybucję Gumbela . Jego funkcją rozkładu skumulowanego jest
i można go łatwo odwrócić: przywołanie funkcji logarytmu naturalnego jest odwrotnością funkcji wykładniczej , więc od razu jest oczywiste, że funkcja kwantylu dla rozkładu Gumbela jest
Jak widać, funkcja kwantylu, zgodnie z alternatywną nazwą, „odwraca” zachowanie funkcji rozkładu skumulowanego.
Uogólniona funkcja rozkładu odwrotnego
Nie każda funkcja ma odwrotność. Dlatego cytowany cytat mówi „monotonicznie rosnąca funkcja”. Przypomnijmy, że z definicji funkcji należy przypisać dla każdej wartości wejściowej dokładnie jedno wyjście. Funkcje rozkładu skumulowanego dla ciągłych zmiennych losowych spełniają tę właściwość, ponieważ rosną monotonicznie. W przypadku dyskretnych zmiennych losowych skumulowane funkcje rozkładu nie są ciągłe i rosną, dlatego używamy uogólnionych funkcji rozkładu odwrotnego, które muszą być nie malejące. Bardziej formalnie, uogólniona funkcja rozkładu odwrotnego jest zdefiniowana jako
Definicja, przetłumaczona na zwykły angielski, mówi, że dla danej wartości prawdopodobieństwa szukamy pewnej wartości , co powoduje, że zwraca wartość większą lub równą niż , ale ponieważ może istnieć wiele wartości które to spełniają warunek (np. jest prawdą dla dowolnego ), więc bierzemy najmniejszą z nich.p x F(x) p x F(x)≥0 x x
Funkcje bez odwrotności
Ogólnie rzecz biorąc, nie ma odwrotności dla funkcji, które mogą zwracać tę samą wartość dla różnych danych wejściowych, na przykład funkcji gęstości (np. Standardowa funkcja normalnej gęstości jest symetryczna, więc zwraca te same wartości dla i itd.). Rozkład normalny jest interesującym przykładem z jeszcze jednego powodu - jest to jeden z przykładów skumulowanych funkcji rozkładu, które nie mają odwróconej postaci zamkniętej . Nie każda funkcja rozkładu skumulowanego musi mieć odwrotną postać zamkniętą ! Mam nadzieję, że w takich przypadkach odwrotności można znaleźć metodami numerycznymi.−2 2
Przypadek użycia
Funkcja kwantylu może być używana do generowania losowego, jak opisano w Jak działa metoda transformacji odwrotnej?
źródło
Tim miał bardzo dokładną odpowiedź. Dobra robota!
Chciałbym dodać jeszcze jedną uwagę. Nie każda monotonicznie rosnąca funkcja ma funkcję odwrotną. W rzeczywistości tylko ściśle monotonicznie rosnące / malejące funkcje mają funkcje odwrotne.
Dla monotonicznie rosnącego cdf, który nie jest ściśle monotonicznie rosnący, mamy funkcję kwantylową, która jest również nazywana funkcją odwrotnego skumulowanego rozkładu. Więcej informacji znajdziesz tutaj .
źródło