Dlaczego ranga macierzy kowariancji wynosi co najwyżej

17

Jak stwierdzono w tym pytaniu, maksymalna ranga macierzy kowariancji wynosi n1 gdzie n jest rozmiarem próbki, a więc jeśli wymiar macierzy kowariancji jest równy wielkości próbki, byłby liczbą pojedynczą. Nie mogę zrozumieć, dlaczego mamy odjąć 1 od maksymalnej rangi n macierzy kowariancji.

użytkownik3070752
źródło
1
Aby uzyskać intuicję, pomyśl o n=2 punktach w 3D. Jaka jest wymiarowość podprzestrzeni, w której znajdują się te punkty? Czy umieścisz je w linii (podprzestrzeń 1D)? A może potrzebujesz płaszczyzny (podprzestrzeń 2D)?
ameba mówi Przywróć Monikę
Rozumiesz więc, że n=2 prowadzi do macierzy kowariancji rangi 1? Dobra, weźmy n=3 punkty. Czy widzisz, że zawsze możesz dopasować je do płaszczyzny 2D?
ameba mówi Przywróć Monikę
4
@amoeba twój przykład był jasny, ale nie rozumiem, jaki jest związek między dopasowaniem hiperpłaszczyzny w twoim przykładzie a macierzą kowariancji?
user3070752
Przepraszam za spóźnienie ;)
user3070752 16.10.16

Odpowiedzi:

20

Bezstronny estymator przykładowej macierzy kowariancji dla punktów danych x iR d wynosi C = 1nxiRdgdzie ˉ x =xi/njest średnią dla wszystkich punktów. Oznaczmy(xi- ˉ x )jako

C=1n1i=1n(xix¯)(xix¯),
x¯=xi/n(xix¯) . The 1ziWspółczynnik 1 nie zmienia rangi, a każdy termin w sumie ma (z definicji) rangę1, więc rdzeń pytania jest następujący:1n11

Dlaczego mają stopień n - 1 , a nie stopień n , gdyż wydaje się, ponieważ jesteśmy zsumowanie n rank- 1 matryc?zizin1nn1

Odpowiedź jest taka, że ​​dzieje się tak, ponieważ nie są niezależne. Z założenia ∑ z i = 0 . Więc jeśli wiesz, n - 1 z Z i wówczas jest to ostatni pozostały z n jest całkowicie zdeterminowany; nie sumujemy n niezależnych macierzy rangi- 1 , sumujemy tylko n - 1zizi=0n1ziznn1n1 niezależnych macierzy rangi , a następnie dodajemy jeszcze jedną macierz rangi 1 , która jest całkowicie liniowo określona przez resztę. Ten ostatni dodatek nie zmienia ogólnej rangi.11

Możemy to zobaczyć bezpośrednio, jeśli przepisujemy jako z n = - n - 1 i = 1 z i , a teraz podłączamy to do powyższego wyrażenia: n i = 1 z i z i = n - 1 i = 1 z i z i + ( - n - 1 z i ) zzi=0

zn=i=1n1zi,
Teraz jest tylkon-1
i=1nzizi=i=1n1zizi+(i=1n1zi)zn=i=1n1zi(zizn).
n1 w sumie pozostało warunków i staje się jasne, że cała suma może mieć najwyżej rangę .n1

Nawiasem mówiąc, wynik ten wskazuje, dlaczego czynnik w bezstronnym estymatorze kowariancji wynosi 1n1 a nie .1n

n1x¯ jest równoważne centrowaniu w powyższym argumencie algebraicznym.

ameba mówi Przywróć Monikę
źródło
0

Uważam, że nieco krótsze wyjaśnienie wygląda następująco:

nmxnm jest liczbą próbek dla każdej zmiennej. Załóżmy, że żadna ze zmiennych nie jest zależna liniowo.

xmin(n,m) .

nmz zmiennych wyśrodkowanych rzędowo:

z=xE[x]

min(n,m1) , ponieważ każdy wiersz danych podlega teraz ograniczeniom:

i=1mzi=0 .

z macierzy nawet jeśli jedna z kolumn jest usuwany.

x staje się:

cov(x,x)=1m1zzT

rank(zzT)

rank(zzT)=rank(z)=min(n,m1)

Mikel
źródło