Istnieją trzy losowe zmienne, . Trzy korelacje między trzema zmiennymi są takie same. To jest,
Jaka jest najściślejsza granica, jaką możesz dla ρ ?
correlation
correlation-matrix
użytkownik1352399
źródło
źródło
Odpowiedzi:
Wspólna korelacjaρ może mieć wartość +1 ale nie −1 . Jeśli ρX,Y=ρX,Z=−1 , to ρY,Z nie może być równe −1 ale w rzeczywistości wynosi +1 . Najmniejszą wartością wspólnej korelacji trzech zmiennych losowych jest −12 . Mówiąc bardziej ogólnie, minimalna wspólna korelacjan zmiennych losowych wynosi−1n−1
gdy traktowane jako wektory, znajdują się na wierzchołkach simpleksu (o wymiarzen−1 ) wprzestrzenin wymiarowej.
Rozważ wariancję sumy zmiennych losowychn jednostek wariancji Xi . Mamy to
gdzie ˉ ń jestwartość średniazwspółczynniki korelacji. Ale ponieważ, łatwo otrzymujemy z
że
Tak więc średnia wartość współczynnika korelacji wynosi co najmniej . Jeśli wszystkie współczynniki korelacji mają tę samą wartość , to ich średnia również jest równa a więc mamy to Czy możliwe są zmienne losowe, dla których wspólna wartość korelacji jest równa ? Tak. Załóżmy, że są nieskorelowanymi zmiennymi losowymi wariancji jednostek i . Następnie , podczas gdy−1n−1 ρ ρ
źródło
Najściślejsza możliwa granica to .−1/2≤ρ≤1 Wszystkie takie wartości mogą się faktycznie pojawić - żadne nie jest niemożliwe.
Aby pokazać, że w wyniku nie ma nic szczególnie głębokiego lub tajemniczego, ta odpowiedź najpierw przedstawia całkowicie elementarne rozwiązanie, wymagające jedynie oczywistego faktu, że wariancje - będące oczekiwanymi wartościami kwadratów - muszą być nieujemne. Po tym następuje ogólne rozwiązanie (które wykorzystuje nieco bardziej wyrafinowane fakty algebraiczne).
Podstawowe rozwiązanie
Wariancja dowolnej liniowej kombinacji musi być nieujemna.x,y,z Niech wariancje tych zmiennych wynoszą odpowiednio i . Wszystkie są niezerowe (w przeciwnym razie niektóre korelacje nie zostałyby zdefiniowane). Korzystając z podstawowych właściwości wariancji, możemy obliczyćσ2,τ2, υ2
dla wszystkich liczb rzeczywistych .(α,β,γ)
Zakładając , mała manipulacja algebraiczna implikuje, że jest to równoważne zα+β+γ≠0
Kwadrat po prawej stronie to stosunek dwóch średnich mocy . Elementarna mocy średniej nierówność (z wagą ) zapewnia, że stosunek nie przekracza (i będzie wynosić , gdy ). Trochę więcej algebry to sugeruje(α,β,γ) (1/3,1/3,1/3) 1 1 α=β=γ≠0
Wyraźny przykład poniżej (obejmujący trywialne zmienne normalne ) pokazuje, że wszystkie takie wartości, , faktycznie powstają jako korelacje. W tym przykładzie użyto tylko definicji wielowymiarowych normalnych, ale w innym przypadku nie wywołuje wyników rachunku różniczkowego lub algebry liniowej.n=3 (x,y,z) −1/2≤ρ≤1
Ogólne rozwiązanie
Przegląd
Każda macierz korelacji jest macierzą kowariancji znormalizowanych zmiennych losowych, skąd - podobnie jak wszystkie macierze korelacji - musi być dodatnia półokreślona. Odpowiednio jego wartości własne nie są ujemne. Nakłada to prosty warunek na : nie może być mniejszy niż (i oczywiście nie może przekraczać ). Odwrotnie, każda taka rzeczywiście odpowiada macierzy korelacji pewien rozkład trivariate, potwierdzające te granice są możliwie szczelnego.ρ −1/2 1 ρ
Wyprowadzenie warunków naρ
Rozważ macierz korelacji na ze wszystkimi wartościami nie przekątnymi równymi(Pytanie dotyczy przypadku ale tej uogólnienia nie jest już trudniej analizować.) Nazwijmy to Z definicji jest wartością własną, pod warunkiem, że istnieje niezerowy wektor taki żen n ρ. n=3, C(ρ,n). λ xλ
Te wartości własne są łatwe do znalezienia w niniejszej sprawie, ponieważ
Letting , oblicz to1=(1,1,…,1)′
Niech z tylko w miejscu (dla ), oblicz toyj=(−1,0,…,0,1,0,…,0) 1 jth j=2,3,…,n
Ponieważ znalezionych wcześniej wektorów własnych obejmuje całą przestrzeń wymiarową (dowód: łatwa redukcja rzędu pokazuje wartość bezwzględną ich wyznacznika równą , która jest niezerowa), stanowią one podstawę wszystkich wektorów własnych. W związku z tym znaleźliśmy wszystkie wartości własne i ustaliliśmy, że są to lub (te ostatnie z wielokrotnością ). Oprócz dobrze znanej nierówności spełniają wszystkie korelacje, brak negatywności pierwszej wartości własnej dodatkowo implikujen n n 1+(n−1)ρ 1−ρ n−1 −1≤ρ≤1
podczas gdy brak negatywności drugiej wartości własnej nie stwarza żadnych nowych warunków.
Dowód wystarczalności warunków
Implikacje działają w obu kierunkach: pod warunkiem macierz jest nieujemna i dlatego jest prawidłową macierzą korelacji. Jest to na przykład macierz korelacji dla rozkładu wielomianowego. W szczególności pisz−1/(n−1)≤ρ≤1, C(ρ,n)
dla odwrotności kiedy Na przykład, gdyC(ρ,n) −1/(n−1)<ρ<1. n=3
Niech wektor zmiennych losowych ma funkcję rozkładu(X1,X2,…,Xn)
gdzie . Na przykład, gdy jest to równex=(x1,x2,…,xn) n=3
Macierz korelacji dla tych zmiennych losowych ton C(ρ,n).
Kontury funkcji gęstości Od lewej do prawej . Zauważ, jak gęstość przesuwa się od koncentracji w pobliżu płaszczyzny do koncentracji w pobliżu linii .fρ,3. ρ=−4/10,0,4/10,8/10 x+y+z=0 x=y=z
Przypadki specjalne i można również zrealizować przez rozkłady zdegenerowane ; Nie będę wchodził w szczegóły, poza zaznaczeniem, że w pierwszym przypadku dystrybucję można uznać za obsługiwaną na hiperpłaszczyźnie , gdzie jest to suma identycznie rozmieszczonych średnich Rozkład normalny, podczas gdy w tym drugim przypadku (idealna korelacja dodatnia) jest obsługiwany na linii generowanej przez , gdzie ma średnią Rozkład normalny.ρ=−1/(n−1) ρ=1 x.1=0 0 1′ 0
Więcej o nie-degeneracji
Przegląd tej analizy wyjaśnia, że macierz korelacji ma rangę a ma rangę z (ponieważ tylko jeden wektor własny ma niezerową wartość własną). Dla powoduje to degenerację macierzy korelacji w obu przypadkach. W przeciwnym razie istnienie jego odwrotności dowodzi, że nie jest on generowany.C(−1/(n−1),n) n−1 C(1,n) 1 n≥2 Σ(ρ,n)
źródło
Twoja macierz korelacji jest
Macierz jest dodatnia półfinałowa, jeśli wszyscy główni nieletni są nieujemni. Głównymi nieletnimi są wyznaczniki „północno-zachodnich” bloków macierzy, tj. 1, wyznacznik
oraz wyznacznik samej macierzy korelacji.
1 jest oczywiście dodatnia, drugim zasadniczym nieletnim jest , co nie jest ujemne dla żadnej dopuszczalnej korelacji . Wyznacznikiem całej macierzy korelacji jest1−ρ2 ρ∈[−1,1]
Wykres pokazuje wyznacznik funkcji w zakresie dopuszczalnych korelacji .[−1,1]
Widzisz, że funkcja jest nieujemna w zakresie podanym przez @stochazesthai (który możesz również sprawdzić, znajdując pierwiastki równania determinantalnego).
źródło
Istnieją zmienne losowe , i z parami korelacji tylko wtedy, gdy macierz korelacji jest dodatnia półfinałowa. Dzieje się tak tylko dla .X Y Z ρXY=ρYZ=ρXZ=ρ ρ∈[−12,1]
źródło