Myślę, że odpowiedź powinna brzmieć „tak”, ale nadal czuję, że coś jest nie tak. W literaturze powinny być jakieś ogólne wyniki, czy ktoś mógłby mi pomóc?
covariance
matrix
covariance-matrix
linear-algebra
Jingjings
źródło
źródło
Odpowiedzi:
Nie.
Rozważmy trzy zmienne, , i . Ich macierz kowariancji, , nie jest określona dodatnio, ponieważ istnieje wektor ( )), dla którego nie jest dodatni.X Y Z=X+Y M z =(1,1,−1)′ z′Mz
Macierze kowariancji populacji są dodatnie półokreślone.
(Zobacz właściwość 2 tutaj .)
To samo powinno ogólnie dotyczyć macierzy kowariancji pełnych próbek (bez brakujących wartości), ponieważ można je również postrzegać jako formę dyskretnej kowariancji populacji.
Jednak z powodu niedokładności obliczeń liczb zmiennoprzecinkowych nawet algebraicznie dodatnie określone przypadki mogą czasami zostać obliczone tak, aby nie były nawet dodatnimi półokreślonymi; dobry wybór algorytmów może w tym pomóc.
Mówiąc bardziej ogólnie, przykładowe macierze kowariancji - w zależności od tego, jak radzą sobie z brakującymi wartościami w niektórych zmiennych - mogą, ale nie muszą, być półokreślone dodatnio, nawet teoretycznie. Jeśli na przykład zastosowano usuwanie parami, nie ma gwarancji pozytywnej półokreśloności. Ponadto, skumulowany błąd numeryczny może spowodować, że matryce kowariancji próbki, które powinny być teoretycznie dodatnie półokreślone, nie będą.
Tak jak:
Stało się tak w pierwszym przykładzie, który próbowałem (prawdopodobnie powinienem dostarczyć ziarno, ale nie jest tak rzadkie, że powinieneś spróbować wielu przykładów, zanim je zdobędziesz).
Wynik okazał się ujemny , chociaż powinien być algebraicznie zerowy. Inny zestaw liczb może dawać liczbę dodatnią lub „dokładne” zero.
-
Przykład umiarkowanego braku prowadzącego do utraty dodatniej półszlachetności poprzez usunięcie parami:
źródło
Cóż, aby zrozumieć, dlaczego macierz kowariancji populacji jest zawsze dodatnia półokreślona, zauważ, że: gdzie to niektóre liczby rzeczywiste, a to niektóre losowe zmienne o wartościach rzeczywistych.
Wyjaśnia to również, dlaczego w przykładzie podanym przez Glen_b macierz kowariancji nie była pozytywnie określona. Mieliśmy , a , więc , a wariancja zmiennej losowej, która jest stała, wynosi .X 1 = X , X 2 = Y , X 3 = Z = X + Y ∑ 3 i = 1 y i X i = 0 0y1=1,y2=1,y3=−1 X1=X,X2=Y,X3=Z=X+Y ∑3i=1yiXi=0 0
źródło