Prognozowanie regresji kwantowej

13

Jestem zainteresowany wykorzystaniem regresji kwantylowej dla niektórych moich modeli, ale chciałbym uzyskać wyjaśnienia na temat tego, co mogę osiągnąć przy użyciu tej metodologii. Rozumiem mogę uzyskać bardziej solidną analizę IV / DV relacji , zwłaszcza w obliczu skrajnych i heteroskedastyczności, ale w moim przypadku nacisk kładziony jest na przewidywania.

W szczególności jestem zainteresowany poprawieniem dopasowania moich modeli, bez uciekania się do bardziej złożonych modeli nieliniowych, a nawet fragmentarycznej regresji liniowej. Czy przy prognozowaniu można wybrać kwantyl wyniku o najwyższym prawdopodobieństwie na podstawie wartości predyktorów? Innymi słowy, czy możliwe jest określenie każdego przewidywanego prawdopodobieństwa kwantylu wyniku na podstawie wartości predyktorów?

Robert Kubrick
źródło

Odpowiedzi:

8

Prawa strona modelu w regresji kwantowej ma taką samą strukturę i typy założeń, jak inne modele regresji, takie jak OLS. Główne różnice w regresji kwantylowej polegają na tym, że bezpośrednio prognozuje się kwantyle rozkładu uwarunkowane względem bez uciekania się do parametrycznych manipulacji dystrybucyjnych (np. ) i że nie zakłada się żadnego rozkładu dystrybucyjnego reszt niż zakładanie, że jest zmienną ciągłą.X ˉ x ± 1,96 s YYXx¯±1.96sY

Frank Harrell
źródło
1
Myślę, że rozumiem, jak działa proces dopasowania. Nie rozumiem, czy istnieje sposób na poprawę przewidywania (wybór parametrów kwantylu) bez wiedzy, w którym kwantylu będzie obserwacja. Czy możemy w jakiś sposób wyprowadzić to z wartości predyktorów? Być może istnieje coś, co można zastosować w oparciu o rozkład prawdopodobieństwa predyktorów vs. obserwacje.
Robert Kubrick
2
Myślę, że musisz wykonać znaczną ilość czytania w tle na temat regresji kwantowej. Obserwacje nie leżą „w kwantylach”. Kwantyl jest właściwością ciągłego rozkładu. Kwantyl 0,5 jest medianą; kwantyl 0,75 jest górnym kwartylem. 0,75 kwantyla jest 75. percentylem gdy . Y X = xY|X=xYX=x
Frank Harrell
2
Frank, jestem pewien, że muszę dowiedzieć się więcej o regresji kwantowej. Zanim się zanurzę, chciałbym zrozumieć, czy ta metodologia może zaoferować jakiś element probabilistyczny do wyboru kwantylu, w oparciu o predyktory i dopasowany model. Dla każdego podanego zestawu / zakresu wartości predyktorów musi istnieć prawdopodobieństwo, że rzeczywisty wynik spadnie w pewnym regionie kwantylu.
Robert Kubrick
4

Regresja kwantylowa polega na przewidywaniu kwantyli zmiennej zależnej. W regresji „regularnej” przewidujemy średnią DV. Ale zainteresowanie może być w innych częściach DV. Np. Możesz być zainteresowany przewidywaniem, które noworodki będą bardzo lekkie, które piosenki będą wyjątkowo popularne lub którzy klienci kupią mnóstwo rzeczy.

W zeszłym roku napisałem o tym dla NESUG .

Peter Flom - Przywróć Monikę
źródło
2
Ty wybierasz kwantyl do przewidzenia na podstawie tego, co chcesz wiedzieć. Żaden program nie powie Ci, jakie pytanie zadać!
Peter Flom - Przywróć Monikę
1
Biorąc pod uwagę dopasowany model, czy nie możesz obliczyć prawdopodobieństwa, że ​​przewidywana wartość spadnie do kwantyla 0.6, na podstawie wartości predyktora?
Robert Kubrick,
2
Nie „w kwantyle .6”, ale w kwantyle 0,6 lub powyżej, ale tak. Ale musisz zdecydować, który kwantyl chcesz przewidzieć. W regresji OLS przewidujesz średnią warunkową; w regresji kwantylowej przewidujesz kwantyle warunkowe
Peter Flom - Przywróć Monikę
5
Jak wskazał Piotr, nadal nie rozumiesz wcześniejszych komentarzy. Regresja kwantylowa nie ma nic wspólnego z obliczaniem prawdopodobieństwa upadku powyżej lub poniżej pewnego kwantyla (zauważ, że prawdopodobieństwo upadku „w” kwantyle 0,6 jest z definicji zerowe). Dowiedz się, czy jesteś zainteresowany prognozowaniem mediany lub innych kwantyli, a następnie zrób to. Kwantyl warunkowy to pojedyncza liczba, a nie zakres.
Frank Harrell,
1
Jeśli rozumiem, wybieracie kwantyl, który ma być użyty do prognoz ur, ale czy nie ma sposobu na wybranie, który kwantyl jest najlepszy do przewidywania e