Mam nadzieję uzyskać intuicyjne i przystępne wyjaśnienie regresji kwantowej.
Powiedzmy, że mam prosty zestaw danych wyniku i predyktorów .X 1 , X 2
Jeśli na przykład uruchomię regresję przy 0,25, 0,5, 0,75 i odzyskam .
Czy wartości znaleźć po prostu uporządkując wartości i wykonując regresję liniową na podstawie przykładów, które są w / w pobliżu danego kwantylu?y
Czy też wszystkie próbki przyczyniają się do oszacowań , z malejącymi wagami wraz ze wzrostem odległości od kwantylu?
A może to coś zupełnie innego? Muszę znaleźć dostępne wyjaśnienie.
quantile-regression
Jeremy
źródło
źródło
Odpowiedzi:
Polecam Koenker i Hallock (2001, Journal of Economic Perspectives) i tytułowy podręcznik Koenkera .
Twoja intuicja jest więc całkiem poprawna: wszystkie próbki przyczyniają się do oszacowań , z wagami asymetrycznymi zależnymi od kwantylu którego dążymy.τβ τ
źródło
foo <- sample(x=c(1,2,4,10),size=1e6,prob=c(.4,.2,.2,.2),replace=TRUE); xx <- seq(1,10,by=.1); plot(xx,sapply(xx,FUN=function(yy)mean(abs(yy-foo))),type="l")
Podstawowa idea regresji kwantowej wynika z faktu, że analityk jest zainteresowany dystrybucją danych, a nie tylko środkiem danych. Zacznijmy od średniej.
Z drugiej strony regresja mediany szuka linii, która oczekuje, że połowa danych jest po bokach. W tym przypadku funkcją docelową jestgdziejest pierwszą normą.| . |argminβ|y−Xβ| |.|
Rozszerzenie idei mediany na kwantyle powoduje regresję kwantyli. Chodzi o to, aby znaleźć linię, która procent danych jest poza tym.α
Tutaj popełniłeś niewielki błąd, regresja Q nie jest jak znalezienie kwantyla danych, a następnie dopasowanie linii do tego podzbioru (lub nawet trudniejszych granic).
Regresja Q szuka linii dzielącej dane na q kwantyl i resztę . Funkcja docelowa, mówiąc, że funkcją sprawdzającą regresji Q jest β a- = Arg min β { a- | y - X β | I ( y > X β ) + ( 1 - α ) | y - X β | I ( y < X β ) } .α
Jak widzisz, ta sprytna funkcja celu to nic innego jak przełożenie kwantyla na problem optymalizacji.
Ponadto, jak widać, regresja Q jest zdefiniowana dla określonego kwantu ( ), a następnie może zostać rozszerzona, aby znaleźć wszystkie kwantyle. Innymi słowy, regresja Q może odtwarzać (warunkowy) rozkład odpowiedzi.βα
źródło