Rozważ prostą regresję (nie zakłada się normalności): gdzie jest ze średnią i odchyleniem standardowym . Są najmniej kwadratowe Szacunki i nieskorelowane?
11
Rozważ prostą regresję (nie zakłada się normalności): gdzie jest ze średnią i odchyleniem standardowym . Są najmniej kwadratowe Szacunki i nieskorelowane?
Odpowiedzi:
Jest to ważna kwestia przy projektowaniu eksperymentów, w których pożądane może być brak (lub bardzo mała) korelacja między szacunkami i . Taki brak korelacji można osiągnąć kontrolując wartości .za^ b^ Xja
Aby przeanalizować wpływ na oszacowania, wartości (które są wektorami rzędów o długości ) są montowane pionowo w macierzy , macierzy projektowej, mają tyle wierszy, ile jest danych i (oczywiście ) dwie kolumny. Odpowiednie są złożone w jeden długi (kolumnowy) wektor . W tych kategoriach, pisząc dla zmontowanych współczynników, model jestXja ( 1 ,Xja) 2) X Yja y β= ( a , b)′
jest (zazwyczaj) zakłada się niezależnymi zmiennymi losowymi których odchylenia są stałe z nieznanych . Za obserwacje zależne uważa się jedną realizację losowej zmiennej o wartości wektorowej .Yja σ2) σ> 0 y Y
Rozwiązaniem OLS jest
zakładając, że istnieje odwrotność macierzy. Zatem stosując podstawowe właściwości mnożenia macierzy i kowariancji,
Macierz ma tylko dwa wiersze i dwie kolumny, odpowiadające parametrom modelu . Korelacja z jest proporcjonalny do elementów niediagonalnych które z reguły Cramera są proporcjonalne do iloczyn skalarny dwóch kolumnach . Ponieważ jedna z kolumn ma wszystkie s, a iloczyn iloczynu z drugą kolumną (składającą się z ) jest ich sumą, znajdujemy(X′X)- 1 ( a , b ) za^ b^ (X′X)- 1, X 1 Xi
Ten warunek ortogonalności często osiąga się przez recentering się (poprzez odjęcie ich średnią od siebie). Chociaż nie zmieni to szacowanego nachylenia , zmienia szacowany przecięcie . To, czy jest to ważne, zależy od aplikacji.Xi b^ a^
Ta analiza dotyczy regresji wielokrotnej: macierz projektowa będzie mieć kolumn dla zmiennych niezależnych (dodatkowa kolumna składa się z s), a będzie wektorem długości , ale w przeciwnym razie wszystko przebiega tak jak poprzednio.p+1 p 1 β p+1
W języku konwencjonalnym dwie kolumny są nazywane ortogonalnymi, gdy ich iloczyn iloczynu wynosi zero. Gdy jedna kolumna (powiedzmy kolumnie ) jest prostopadła do pozostałych kolumnach, to łatwo wykazać algebraiczne, że wszystkie wpisy niediagonalnych w rzędzie i kolumny z są zerowe (to znaczy, komponenty i dla wszystkich są zerowe). W konsekwencji,X X i i i (X′X)−1 ij ji j≠i
Wiele standardowych projektów eksperymentalnych polega na wyborze wartości zmiennych niezależnych, aby kolumny były wzajemnie prostopadłe. To „oddziela” otrzymane szacunki, gwarantując - zanim jakiekolwiek dane zostaną zebrane! - że oszacowania będą nieskorelowane. (Gdy odpowiedzi mają rozkład normalny, oznacza to, że szacunki będą niezależne, co znacznie upraszcza ich interpretację).
źródło