Jak w praktyce obliczana jest macierz błędów var / cov za pomocą pakietów analizy statystycznej?
Ten pomysł jest dla mnie jasny w teorii. Ale nie w praktyce. Mam na myśli, że jeśli mam wektor zmiennych losowych , rozumiem, że macierz wariancji / kowariancji Σ otrzyma zewnętrzny iloczyn odchylenia od-od- średnie wektory: Σ = E [ ( X - E ( X ) ) ( X - E ( X ) ) ⊤ ] .
Ale kiedy mam próbkę, błędy moich obserwacji nie są zmiennymi losowymi. Albo lepiej, są, ale tylko jeśli pobiorę pewną liczbę identycznych próbek z tej samej populacji. W przeciwnym razie są podane. Ponownie moje pytanie brzmi: w jaki sposób pakiet statystyczny może wytworzyć macierz var / cov, zaczynając od listy obserwacji (tj. Próbki) dostarczonej przez badacza?
variance
error
covariance-matrix
beta-regression
Riccardo
źródło
źródło
Odpowiedzi:
Macierz kowariancji dla modelu typu jest zwykle obliczana jako ( X t X ) - 1 σ 2y= Xβ+ ϵ gdzieσ2resztowa suma kwadratówσ2=Σi(yI-Xi β )2orazdjest stopni swobody (zazwyczaj liczba obserwacji minus liczba parametrów).
W przypadku solidnych i / lub klastrowanych błędów standardowych, produkt jest nieznacznie zmodyfikowany. Mogą istnieć również inne sposoby obliczania macierzy kowariancji, np. Sugerowane przez oczekiwanie na produkty zewnętrzne.XtX
źródło
Jest to uwzględnione w Regresji praktycznej i Anovie przy użyciu R. Juliana J. Faraway'a, strona 21 .
Przykład obliczeń w badania, w oparciu o model liniowy mil na galon regresji na wielu modelach samochodów specyfikacji zawartych w
mtcars
bazie danych:ols = lm(mpg ~ disp + drat + wt, mtcars)
. Są to obliczenia ręczne i dane wyjściowelm()
funkcji:oszacowano jak na stronie 8 tego dokumentu online jako
źródło
źródło