Czym jest kowariancja w prostym języku?

92

Co to jest kowariancja w prostym języku i w jaki sposób jest ona powiązana ze strukturą zależności , korelacji i struktury wariancji-kowariancji w odniesieniu do schematów powtarzanych pomiarów?

stan
źródło

Odpowiedzi:

82

Kowariancja jest miarą tego, jak zmiany w jednej zmiennej są powiązane ze zmianami w drugiej zmiennej. W szczególności kowariancja mierzy stopień, w jakim dwie zmienne są liniowo powiązane. Jest jednak często wykorzystywany nieformalnie jako ogólna miara monotonicznie powiązanych dwóch zmiennych. Istnieje wiele przydatnych intuicyjne wyjaśnienia kowariancji tutaj .

Jeśli chodzi o związek kowariancji z każdym z wymienionych terminów:

[1,1]±10

00

                wprowadź opis zdjęcia tutaj

0

(3) Struktura wariancji / kowariancji (często nazywana po prostu strukturą kowariancji ) w projektach z powtarzanymi pomiarami odnosi się do struktury stosowanej do modelowania faktu, że powtarzane pomiary na osobnikach są potencjalnie skorelowane (a zatem zależne) - odbywa się to poprzez modelowanie wpisy w macierzy kowariancji powtarzanych pomiarów. Jednym z przykładów jest wymienna struktura korelacji ze stałą wariancją, która określa, że ​​każdy powtarzany pomiar ma tę samą wariancję, a wszystkie pary pomiarów są jednakowo skorelowane. Lepszym wyborem może być określenie struktury kowariancji, która wymaga dwóch pomiarów oddalonych od siebie w czasie, aby być mniej skorelowanym (np.model autoregresyjny ). Zauważ, że termin struktura kowariancji pojawia się bardziej ogólnie w wielu rodzajach analiz wielowymiarowych, w których obserwacje mogą być skorelowane.

Makro
źródło
2
twoje wyjaśnienie jest miłe. Potem następuje cenny suplement, który wywołał interesującą serię komentarzy. Wielkie dzięki wszystkim :)!
stan
23

Odpowiedź makro jest doskonała, ale chcę dodać więcej do tego, w jaki sposób kowariancja jest związana z korelacją. Kowariancja tak naprawdę nie mówi o sile związku między dwiema zmiennymi, podczas gdy korelacja tak. Na przykład:

x = [1, 2, 3]
y = [4, 6, 10]

cov(x,y) = 2 #I am using population covariance here

Teraz zmieńmy skalę i pomnóżmy xiy przez 10

x = [10, 20, 30]
y = [40, 60, 100]

cov(x, y) = 200

Zmiana skali nie powinna zwiększać siły związku, więc możemy to dostosować, dzieląc kowariancje przez odchylenia standardowe xiy, co jest dokładną definicją współczynnika korelacji.

W obu powyższych przypadkach współczynnik korelacji między xiy wynosi 0.98198.

Akavall
źródło
6
„Kowariancja tak naprawdę nie mówi o sile związku między tymi dwiema zmiennymi, podczas gdy korelacja tak”. To stwierdzenie jest całkowicie fałszywe. Dwie miary to identyczne skalowanie modularne według dwóch odchyleń standardowych.
David Heffernan
15
@DavidHeffernan, tak, jeśli skalowane według standardowych odchyleń, wówczas kowariancja mówi nam o sile związku. Jednak miara kowariancji przez to ja nie mówi nam tego.
Akavall,
10
@DavidHeffernan, myślę, że Akavall mówi, że jeśli nie znasz skali zmiennych, kowariancja nie mówi ci nic o sile związku - tylko znak można zinterpretować.
Makro
6
W jakiej praktycznej sytuacji można uzyskać kowariancję, nie będąc również w stanie uzyskać dobrego oszacowania skali zmiennych?
David Heffernan
7
Jednak nie zawsze trzeba znać odchylenie standardowe, aby zrozumieć skalę zmiennej, a zatem siłę relacji. Niestandardowe efekty są często pouczające. Na przykład, jeśli udział w szkoleniu powoduje, że ludzie średnio zwiększają tam dochód o 10.000 USD rocznie, jest to prawdopodobnie lepsza wskazówka siły efektu niż stwierdzenie, że istnieje korelacja ar = 0,34 między wykonaniem kursu a przychodem.
Jeromy Anglim