Wiem z poprzednich badań, że
Nie rozumiem jednak, dlaczego tak jest. Widzę, że efektem będzie „podniesienie” wariancji, gdy kowboja A i B bardzo wysoko. Sensowne jest, że gdy tworzysz kompozyt z dwóch wysoce skorelowanych zmiennych, zwykle dodajesz wysokie obserwacje z A z wysokimi obserwacjami z B, a niskie obserwacje z A z niskimi obserwacjami z B. To będzie miało tendencję do tworzyć ekstremalnie wysokie i niskie wartości w zmiennej złożonej, zwiększając wariancję złożonej.
Ale dlaczego zwielokrotnia kowariancję przez dokładnie 2?
variance
covariance
intuition
user1205901 - Przywróć Monikę
źródło
źródło
Odpowiedzi:
Prosta odpowiedź:
Wariancja obejmuje kwadrat:
Zatem twoje pytanie sprowadza się do czynnika 2 w kwadratowej tożsamości:
Które można rozumieć wizualnie jako rozkład pola kwadratu boku na obszar mniejszych kwadratów boków a i b , oprócz dwóch prostokątów boków a i b :(a+b) a b a b
Bardziej zaangażowana odpowiedź:
Jeśli chcesz matematycznie bardziej zaangażowanej odpowiedzi, kowariancja jest formą dwuliniową, co oznacza, że jest liniowa zarówno w pierwszym, jak i drugim argumencie, prowadzi to do:
W ostatnim wierszu wykorzystałem fakt, że kowariancja jest symetryczna:
Podsumowując:
To dwa, ponieważ musisz uwzględnić zarówno i c o v ( B , A ) .cov(A,B) cov(B,A)
źródło
Zbiór zmiennych losowych jest przestrzenią wektorową, a wiele właściwości przestrzeni euklidesowej można do nich analogować. Odchylenie standardowe działa podobnie do długości, a wariancja do kwadratu. Niezależność odpowiada byciu ortogonalnym, a idealna korelacja odpowiada zwielokrotnieniu skalarnemu. Zatem wariancja zmiennych niezależnych jest zgodna z twierdzeniem Pitagorasa:var(A+B)=var(A)+var(B)
.
Jeśli są idealnie skorelowane, to
std(A+B)=std(A)+std(B)
Zauważ, że jest to równoważne z
var(A+B)=var(A)+var(B)+2var(A)var(B)−−−−−−−−−−−√
whereMeasureOfCorrelation=r2 and PerfectCorrelationTerm=2var(A)var(B)−−−−−−−−−−−√
Put in other terms, ifr=correl(A,B) , then
Thus,r2 is analogous to the cos in the Law of Cosines.
źródło
I would add that what you cited is not the definition ofVar(A+B) , but rather a consequence of the definitions of Var and Cov . So the answer to why that equation holds is the calculation carried out by byouness. Your question may really be why that makes sense; informally:
How muchA+B will "vary" depends on four factors:
Which brings us to
źródło