Słyszałem, że częściowe korelacje między zmiennymi losowymi można znaleźć, odwracając macierz kowariancji i pobierając odpowiednie komórki z takiej wynikowej macierzy precyzji (fakt ten jest wspomniany w http://en.wikipedia.org/wiki/Partial_correlation , ale bez dowodu) .
Dlaczego tak jest?
Odpowiedzi:
Gdy wieloczynnikowa zmienna losowa(X1,X2,…,Xn) ma niejednakowaną macierz kowariancji C=(γij)=(Cov(Xi,Xj)) , zbiór wszystkich rzeczywistych kombinacji liniowych Xi tworzy n wymiarową przestrzeń wektora rzeczywistego o podstawie E=(X1,X2,…,Xn) i nie zdegenerowany produkt wewnętrzny podany przez
Jego podwójna podstawa w odniesieniu do tego produktu wewnętrznego ,mi∗= ( X∗1, X∗2), … , X∗n) , jest jednoznacznie określona przez relacje
delta Kroneckera (równa gdy i = j oraz 01 i = j 0 inaczej).
Podwójna podstawa jest przedmiotem zainteresowania tutaj, ponieważ częściowe korelacja i X j otrzymuje się korelacji pomiędzy częścią X í która pozostała po projekcji go w przestrzeń rozpięta przez wszystkich innych wektorów (niech po prostu nazwać jej " resztkowa”, X i ∘ ) oraz porównywalne część X J , resztkowej X j ∘ . Jednak X ∗ i jest wektorem, który jest prostopadły do wszystkich wektorów oprócz X i i ma dodatni iloczyn wewnętrzny z X i skąd X iXja Xjot Xja Xi ∘ Xjot Xj ∘ X∗ja Xja Xja Xi ∘ musi być pewną nieujemną wielokrotnością , i podobnie dla X j . Napiszmy zatemX∗ja Xjot
dla dodatnich liczb rzeczywistych i λ jλja λjot .
Korelacja częściowa jest znormalizowanym iloczynem kropkowym reszt, który nie ulega zmianie przez przeskalowanie:
(W obu przypadkach częściowa korelacja wyniesie zero, ilekroć reszty są ortogonalne, niezależnie od tego, czy są niezerowe).
Musimy znaleźć wewnętrzne produkty podwójnych elementów. W tym celu rozwiń elementy podwójnej podstawy pod względem oryginalnej podstawy :mi
Następnie z definicji
W notacji macierzowej z macierzą tożsamości i B = ( β i j ) macierzą zmiany podstawy, to stwierdzaI =( δI j) B =( βI j)
Oznacza to, że , co dokładnie twierdzi artykuł w Wikipedii. Poprzednia formuła częściowej korelacji podajeB = C- 1
źródło
Oto dowód z samych obliczeń macierzowych.
Doceniam odpowiedź Whuber. Jest bardzo wnikliwy w matematyce za sceną. Jednak nadal nie jest tak trywialne, jak użyć jego odpowiedzi, aby uzyskać znak minus w formule podanej w wikipedii Partial_corelation # Using_matrix_inversion .
Aby uzyskać ten znak minus, oto inny dowód, który znalazłem w „Modelach graficznych Lauriten 1995 Page 130”. Dokonuje się tego po prostu przez niektóre obliczenia macierzowe.
Kluczem jest następująca tożsamość macierzy: gdzie E = A - B D - 1 C , F = D - 1 C i G = B D -
Zapisz macierz kowariancji jako gdzie Ω 11 jest macierzą kowariancji ( X i , X j ), a Ω 22 jest macierzą kowariancji V ∖ { X i , X j } .
Niech . Podobnie zapisz P jako P = ( P 11 P 12 P 21 P 22 )P=Ω−1 P
Według tożsamości macierzy klucza
Wiemy również, że jest macierzą kowariancji ( X i , X j ) | V ∖ { X i , X j } (z Multivariate_normal_distribution # Conditional_distribution ). Korelacja częściowa wynosi zatem ρ X i X j ⋅ V ∖ { X i , X j } = PΩ11−Ω12Ω−122Ω21 (Xi,Xj)|V∖{Xi,Xj}
Używać zapisu, że(k,l)p wprowadzanie matrycyMjest oznaczony[M]kl.
Prosta formuła inwersji macierzy 2 na 2,
Dlatego co właśnie twierdzi artykuł w Wikipedii.
źródło
i=j
, torho_ii V\{X_i, X_i} = -1
w jaki sposób interpretujemy te diagonalne elementy w macierzy dokładności?To wyjaśnia zamieszanie w powyższych komentarzach, a także w Wikipedii. Druga definicja jest powszechnie stosowana z tego, co mogę powiedzieć, więc powinien istnieć znak ujemny.
Pierwotnie opublikowałem edycję drugiej odpowiedzi, ale popełniłem błąd - przepraszam za to!
źródło