Dlaczego oceny głównych składników nie są skorelowane?

10

Przypuśćmy, że jest macierzą danych skoncentrowanych na średnich. Macierz ma , ma różne wartości własne, a wektory własne , \ mathbf s_2 ... \ mathbf s_m , które są ortogonalne.AS=cov(A)m×mms1s2sm

-tego główny składnik (niektórzy nazywają je "wyniki") jest wektor . Innymi słowy, jest to liniowa kombinacja kolumn , gdzie współczynniki Składniki -tym wektor własny .izi=AsiAiS

Nie rozumiem, dlaczego i okazują się nieskorelowane ze wszystkimi . Czy wynika to z faktu, że i są ortogonalne? Na pewno nie, ponieważ mogę łatwo znaleźć macierz i parę wektorów ortogonalnych \ mathbf x, \ mathbf y takie, że \ mathbf B \ mathbf x i \ mathbf B \ mathbf y są skorelowane.zizjijsisjBx,yBxBy

Ernest A.
źródło
Powiązana odpowiedź stats.stackexchange.com/a/110546/3277 .
ttnphns

Odpowiedzi:

7

zizj=(Asi)(Asj)=siAAsj=(n1)siSsj=(n1)siλjsj=(n1)λjsisj=0.
ameba
źródło
1
Matematyka: co za piękny język.
Néstor
4
Oznacza to, że i są ortogonalne. Nieskorelowany oznacza, że ​​musi to być prawda: . Przypuszczam, że jakoś , a następnie również implikuje, że są nieskorelowane. zizj(ziz¯i)(zjz¯j)=0z¯i=z¯j=0zizj=0
Ernest A
2
Dobra uwaga, @Ernest. Średnie są rzeczywiście zerowe, ponieważ dane zostały wyśrodkowane na średnich (zgodnie z twoim założeniem). Wtedy wszystkie prognozy muszą mieć średnią zero.
ameba
2
@Jubbles, ponieważ , dlatego . S=cov(A)=1n1AAAA=(n1)S
Ernest A
2
@Ernest, nie mogłem się powstrzymać przed udzieleniem odpowiedzi nie zawierającej tekstu, ale być może powinienem dodać, że podstawowym powodem, dla którego komputery PC są nieskorelowane, jest to, że ich macierz kowariancji jest podana przez w podstawie wektorów własnych, a na tej podstawie staje się przekątna - - o to właśnie chodzi w składzie eigend. SS
ameba