Czy każda macierz korelacji jest dodatnia?

11

Mówię tu o macierzach korelacji Pearsona.

Często słyszałem, że mówiono, że wszystkie macierze korelacji muszą być dodatnie półfinałowe. Rozumiem, że dodatnie określone macierze muszą mieć wartości własne , podczas gdy dodatnie semidkończone macierze muszą mieć wartości własne 0 . To sprawia, że ​​myślę, że moje pytanie można przeformułować w następujący sposób: „Czy macierze korelacji mogą mieć wartość własną = 0 ?”>00=0

Czy jest możliwe, aby macierz korelacji (wygenerowana z danych empirycznych, bez brakujących danych) miała wartość własną lub wartość własną < 0 ? Co jeśli zamiast tego była to macierz korelacji populacji?=0<0

Przeczytałem na górze odpowiedź na to pytanie dotyczące macierzy kowariancji, że

Rozważmy trzy zmienne, , Y i Z = X + Y . Ich macierz kowariancji, M , nie jest określona dodatnio, ponieważ istnieje wektor z ( = ( 1 , 1 , - 1 ) ), dla którego z M z nie jest dodatni.XYZ=X+YMz=(1,1,1)zMz

Jednakże, jeśli zamiast macierzy kowariancji zrobić te obliczenia na macierzy korelacji następnie wychodzi jako pozytywne. Myślę więc, że być może sytuacja wygląda inaczej w przypadku macierzy korelacji i kowariancji.zMz

Powodem mojego pytania jest to, że zostałem zapytany o przepływ stosu w związku z pytaniem, które tam zadałem.

user1205901 - Przywróć Monikę
źródło
Jeśli na przykład dwa atrybuty są jedną rzeczą, mającą tylko różne nazwy, macierz jest pojedyncza. Jeśli dwa atrybuty dodają do stałej, jest to znowu liczba pojedyncza, i tak dalej .
ttnphns
Jeśli macierz kowariancji jest liczbą pojedynczą, macierz korelacji również jest liczbą pojedynczą.
ttnphns
2
Prawie duplikaty: czy każda macierz korelacji jest dodatnia na półokreślona? która mniej skupia się na kącie określonym względem półokreślonego i czy każda macierz kowariancji jest dodatnia? co jest istotne, ponieważ kowariancja jest zasadniczo przeskalowaną korelacją.
Silverfish,

Odpowiedzi:

16

Macierze korelacji nie muszą być definitywnie dodatnie.

Rozważ skalarną zmienną losową X o niezerowej wariancji. Zatem macierz korelacji X z samą sobą jest macierzą wszystkich, która jest dodatnia półokreślona, ​​ale nie dodatnia określona.

Jeśli chodzi o korelację próbek, rozważ dane przykładowe dla powyższego, mając pierwszą obserwację 1 i 1, a drugą obserwację 2 i 2. To powoduje, że korelacja próbki jest macierzą wszystkich, więc nie jest dodatnia.

Przykładowa macierz korelacji, jeśli jest obliczona z dokładną arytmetyką (tj. Bez błędu zaokrąglenia), nie może mieć ujemnych wartości własnych.

Mark L. Stone
źródło
4
Warto wspomnieć o możliwym wpływie brakujących wartości na przykładową macierz korelacji . Fuzz numeryczny nie jest jedynym powodem uzyskania ujemnej wartości własnej w przykładowej macierzy korelacji / kowariancji.
Silverfish,
1
Tak, nie wyraziłem tego wyraźnie, ale zakładałem, zgodnie z pytaniem, „bez brakujących danych”. Gdy znajdziesz się w dzikim, zwariowanym świecie brakujących danych i ich korekty, wszystko idzie.
Mark L. Stone,
Tak, przepraszam, masz całkowitą rację, pytanie brzmiało „brak brakujących danych” - pomyślałem, że warto o tym wspomnieć, ponieważ przyszli poszukiwacze mogą być zainteresowani, nawet jeśli apetyt PO jest zaspokojony!
Silverfish,
7

X1=X2X1=2X2

n<pn1pn+1n1

ameba
źródło
Prawdziwe dane. Podejrzewam, że mógłbym i powinienem podać te informacje, ale moim celem było stworzenie kontrprzykładu, który obaliłby hipotezę OP, pokazując w ten sposób jej nieważność. Powinieneś jednak dostosować drugie zdanie tak, aby brzmiało: „W tym przypadku macierze kowariancji i korelacji będzie co najwyżej ranga n − 1, więc będzie co najmniej (p − n + 1) zero wartości własnych. ”
Mark L. Stone,
4

XY=2X(X,Y)2X=YE[Y2]=4E[X2]=σY2E[XY]=2E[X2]Cov(X,Y)=E[XY]EXEY=E[XY]

Λ=(1224),
Λ=(1111),
XY
yoki
źródło
2Λcov(X,Y)=E(XY)E(X)E(Y)=2E[X2]=2(σX2+[E(X)]2)E(X2)=Var(X)+[E(X)]2
diagΛ1/2ΛdiagΛ1/2
@AntoniParellada, nie jestem do końca pewien, co masz na myśli - kowariancja tutaj jest bezpośrednim obliczeniem. Ale dokonam edycji i wyjaśnię to. Dzięki.
yoki