Jakie znaczenie ma macierz kapelusza, , w regresji liniowej?

10

Jakie znaczenie ma macierz kapelusza, w analizie regresji?H.=X(XX)-1X

Czy to tylko dla łatwiejszych obliczeń?

użytkownik 31466
źródło
Czy mógłbyś być bardziej szczegółowy?
Steve S,
@ SteveS Właściwie chcę wiedzieć, dlaczego potrzebujemy matrycy Hat?
użytkownik 31466,
Czy pytasz, dlaczego potrzebujemy specjalnej nazwy / symbolu (tj. „Matryca kapelusza”, „ H ”) dla matrycy, czy pytasz więcej o znaczeniu produktu matrycowego po prawej stronie?
Steve S,

Odpowiedzi:

14

W badaniu regresji liniowej podstawowym punktem wyjścia jest proces generowania danych gdzie i deterministyczny. Po zminimalizowaniu kryterium najmniejszych kwadratów można znaleźć estymator dla , tj. . Po podłączeniu estymatora do początkowej formuły otrzymuje się jako liniowy model procesu generowania danych. Teraz można podstawić estymator nay= XB + uuN(0,σ2I)XB^bb^=(XX)-1Xyy^=Xb^b^i dostajey^=X(XX)-1Xy.

Tak więc jest w rzeczywistości macierzą projekcji. Wyobraź sobie, że bierzesz wszystkie zmienne w . Zmienne są wektorami i obejmują spację. Dlatego mnożąc przez , zaobserwowane wartości w na przestrzeń, która jest rozpięta przez zmienne w . Daje to szacunki dla i to jest powód, dla którego nazywa się to macierzą kapelusza i dlatego ma tak duże znaczenie. W końcu regresja liniowa jest niczym więcej niż projekcją, a dzięki macierzy projekcji nie możemy tylko obliczyć szacunków dlaH.=X(XX)-1XXH.yyXyyale także dla i może na przykład sprawdzić, czy naprawdę jest normalnie rozpowszechniany.u

Znalazłem to ładne zdjęcie w Internecie i wizualizuje tę projekcję. Pamiętaj, że jest używane zamiast . Ponadto obraz podkreśla, że ​​wektor terminów błędów jest ortogonalny do projekcji, a zatem nie jest skorelowany z szacunkami dlaβby

wprowadź opis zdjęcia tutaj

losowa osoba
źródło
5

Matryca kapeluszowa jest bardzo przydatna z kilku powodów:

  1. Zamiast mieć , otrzymujemy gdzie jest macierzą kapelusza. To daje nam, że jest liniowym odwzorowaniem obserwowanych wartości.y^=Zβ^y^=P.yP.y^
  2. Z macierzy kapelusza łatwo jest obliczyć resztki . Widzimy, że .P.ϵ^ϵ^=y-y^=y-P.y=(jan-P.)y
wilsnunn
źródło
0

To nic innego jak znalezienie „najbliższego” rozwiązania dla Ax = b, gdzie b nie znajduje się w przestrzeni kolumny A. Projektujemy b na przestrzeń kolumny i rozwiązujemy dla Ax (hat) = p, gdzie p jest rzutem b na przestrzeń kolumny.

Andrew W.
źródło
1
Wszystko to można zrobić bez kiedykolwiek obliczeniowej . H.
whuber