Wzór estymatora regresji kwantowej

11

Widziałem dwie różne reprezentacje estymatora regresji kwantowej

Q(βq)=ja:yjaxjaβnqyja-xjaβq+ja:yja<xjaβn(1-q)yja-xjaβq

i

Q(βq)=i=1nρq(yixiβq),ρq(u)=ui(q-1(uja<0))

gdzie uja=yja-xjaβq . Czy ktoś może mi powiedzieć, jak pokazać równoważność tych dwóch wyrażeń? Oto, czego do tej pory próbowałem, zaczynając od drugiego wyrażenia.

Q(βq)=i=1nui(q1(ui<0))(yixiβq)=i=1n(yixiβq)(q1(yixiβq<0))(yixiβq)=[i:yixiβn(q(yixiβq))+i:yi<xiβn(q(yixiβq)(yixiβq))](yixiβq)
Ale od tego momentu utknąłem, jak postępować. Proszę nie pamiętać, że nie jest to zadanie domowe ani pytanie o zadanie. Wielkie dzięki.
AlexH
źródło

Odpowiedzi:

13

Jeśli pamiętasz, OLS minimalizuje sumę kwadratów reszt podczas gdy regresja mediany minimalizuje sumę absolutnych reszt . Estymator mediany lub najmniejszych odchyleń absolutnych (LAD) jest szczególnym przypadkiem regresji kwantylu, w którym masz . W regresji kwantylowej minimalizujemy sumę błędów bezwzględnych, które otrzymują wagi asymetryczne w przypadku nadmiernego przewidywania i przypadku niedoszacowania. Możesz zacząć od reprezentacji LAD i rozszerzyć ją jako sumę ułamka danych ważonych przez i biorąc pod uwagę ich wartość , i pracować nad tym w następujący sposób:iui2iuiq=.5(1q)qq(1q)ui

ρq(u)=1(ui>0)qui+1(ui0)(1q)ui=1(yixiβq>0)qyixiβq+1(yixiβq0)(1q)yixiβq
Wykorzystuje to po prostu fakt, że a następnie można ponownie napisać funkcję wskaźnika jako sumę obserwacji spełniających warunki wskaźników . To da pierwsze wyrażenie, które zapisałeś dla estymatora regresji kwantowej.ui=yixiβq

=ja:yja>xjaβqnqyja-xjaβq+ja:yjaxjaβqn(1-q)yja-xjaβq=qja:yja>xjaβqnyja-xjaβq+(1-q)ja:yjaxjaβqnyja-xjaβq=qja:yja>xjaβqn(yja-xjaβq)-(1-q)ja:yjaxjaβqn(yja-xjaβq)=qja:yja>xjaβqn(yja-xjaβq)-ja:yjaxjaβqn(yja-xjaβq)+qja:yjaxjaβqn(yja-xjaβq)=qja=1n(yja-xjaβq)-ja=1n1(yja-xjaβq0)(yja-xjaβq)=ja=1n(q-1(uja0))uja

Druga linia usuwa wagi z sumowań. Trzeci wiersz pozbywa się wartości bezwzględnych i zastępuje je wartościami rzeczywistymi. Z definicji ma wartość ujemną za każdym razem, gdy , stąd zmiana znaku w tym wierszu. Czwarta linia mnoży się . Wtedy zdajesz sobie sprawę, że i zastępując sumę terminu średniego w czwartym wierszu odpowiednim wskaźnikiem przybywasz do piątej linii. Faktoryzacja, a następnie zamianayja-xjaβqyja<xjaβq(1-q)

qja:yja>xjaβqn(yja-xjaβq)+qja:yjaxjaβqn(yja-xjaβq)=ja=1n(yja-xjaβq)
yja-xjaβquja
To pokazuje, jak dwa wyrażenia są równoważne.
Andy
źródło