Mówię tu o macierzach korelacji Pearsona.
Często słyszałem, że mówiono, że wszystkie macierze korelacji muszą być dodatnie półfinałowe. Rozumiem, że dodatnie określone macierze muszą mieć wartości własne , podczas gdy dodatnie semidkończone macierze muszą mieć wartości własne ≥ 0 . To sprawia, że myślę, że moje pytanie można przeformułować w następujący sposób: „Czy macierze korelacji mogą mieć wartość własną = 0 ?”
Czy jest możliwe, aby macierz korelacji (wygenerowana z danych empirycznych, bez brakujących danych) miała wartość własną lub wartość własną < 0 ? Co jeśli zamiast tego była to macierz korelacji populacji?
Przeczytałem na górze odpowiedź na to pytanie dotyczące macierzy kowariancji, że
Rozważmy trzy zmienne, , Y i Z = X + Y . Ich macierz kowariancji, M , nie jest określona dodatnio, ponieważ istnieje wektor z ( = ( 1 , 1 , - 1 ) ′ ), dla którego z ′ M z nie jest dodatni.
Jednakże, jeśli zamiast macierzy kowariancji zrobić te obliczenia na macierzy korelacji następnie wychodzi jako pozytywne. Myślę więc, że być może sytuacja wygląda inaczej w przypadku macierzy korelacji i kowariancji.
Powodem mojego pytania jest to, że zostałem zapytany o przepływ stosu w związku z pytaniem, które tam zadałem.
źródło
Odpowiedzi:
Macierze korelacji nie muszą być definitywnie dodatnie.
Rozważ skalarną zmienną losową X o niezerowej wariancji. Zatem macierz korelacji X z samą sobą jest macierzą wszystkich, która jest dodatnia półokreślona, ale nie dodatnia określona.
Jeśli chodzi o korelację próbek, rozważ dane przykładowe dla powyższego, mając pierwszą obserwację 1 i 1, a drugą obserwację 2 i 2. To powoduje, że korelacja próbki jest macierzą wszystkich, więc nie jest dodatnia.
Przykładowa macierz korelacji, jeśli jest obliczona z dokładną arytmetyką (tj. Bez błędu zaokrąglenia), nie może mieć ujemnych wartości własnych.
źródło
źródło
źródło
2