Poniższe odpowiedzi stanowią dowód. Intuicyję można zobaczyć w prostym przypadku var (x + y): jeśli x i y są dodatnio skorelowane, oba będą zwykle duże / małe razem, zwiększając całkowitą zmienność. Jeśli są skorelowane ujemnie, będą się wzajemnie anulować, zmniejszając całkowitą zmienność.
Assad Ebrahim,
Odpowiedzi:
91
Odpowiedź na twoje pytanie brzmi „czasami, ale nie ogólnie”.
Aby to zobaczyć, niech będą zmiennymi losowymi (ze skończonymi wariancjami). Następnie,X1,...,Xn
var(∑i=1nXi)=E⎛⎝[∑i=1nXi]2⎞⎠−[E(∑i=1nXi)]2
Teraz zauważ, że , co jest jasne, jeśli pomyśl o tym, co robisz, obliczając ręcznie . W związku z tym,(∑ni=1ai)2=∑ni=1∑nj=1aiaj(a1+...+an)⋅(a1+...+an)
Jeśli zmienne są skorelowane, nie, nie ogólnie : Załóżmy na przykład, że są dwiema losowymi zmiennymi, z których każda ma wariancję i gdzie . Następnie , więc tożsamość nie powiedzie się.X1,X2σ2cov(X1,X2)=ρ0<ρ<σ2var(X1+X2)=2(σ2+ρ)≠2σ2
ale jest to możliwe w przypadku niektórych przykładów : Załóżmy że mają macierz kowariancji następnieX1,X2,X3
⎛⎝⎜10.4−0.60.410.2−0.60.21⎞⎠⎟
var(X1+X2+X3)=3=var(X1)+var(X2)+var(X3)
Dlatego jeśli zmienne są nieskorelowane, wówczas wariancja sumy jest sumą wariancji, ale odwrotnie nie jest ogólnie prawdą.
W odniesieniu do przykładowej macierzy kowariancji jest następująca poprawność: symetria między górnymi prawymi i dolnymi lewymi trójkątami odzwierciedla fakt, że , ale symetria między lewym górnym a prawym dolnym rogu (w tym przypadku to tylko część przykładu, ale można go zastąpić dwoma różnymi liczby, które sumują się do np. ai ? Jeszcze raz dziękujęcov(Xi,Xj)=cov(Xj,Xi)cov(X1,X2)=cov(X2,X3)=0.30.6cov(X1,X2)=acov(X2,X,3)=0.6−a
Abe
41
Var(∑i=1mXi)=∑i=1mVar(Xi)+2∑i<jCov(Xi,Xj).
Tak więc, jeśli kowariancje średnio wynoszą , co byłoby konsekwencją, gdyby zmienne były nieskorelowane parami lub były niezależne, wówczas wariancja sumy jest sumą wariancji.0
Przykład, w którym nie jest to prawdą: Niech . Niech . Następnie .X 2 = X 1 Var ( X 1 + X 2 ) = Var ( 2 X 1 ) = 4Var(X1)=1X2=X1Var(X1+X2)=Var(2X1)=4
Rzadko będzie to prawdą w przypadku odchyleń próbek.
DW
1
@DWin, „rzadki” to niedopowiedzenie - jeśli mają ciągły rozkład, prawdopodobieństwo, że wariancja próbki sumy jest równa sumie wariancji próbki dokładnie 0 :)X
Macro
15
Chciałem tylko dodać bardziej zwięzłą wersję dowodu podanego przez Macro, więc łatwiej jest zobaczyć, co się dzieje.
Zasadniczo zatem wariancja sumy dwóch zmiennych losowych nie jest sumą wariancji. Jeśli jednak są niezależne, to , a mamy .X,YE(XY)=E(X)E(Y)Var(X+Y)=Var(X)+Var(Y)
Zauważ, że możemy wygenerować wynik dla sumy zmiennych losowych za pomocą prostej indukcji.n
Odpowiedzi:
Odpowiedź na twoje pytanie brzmi „czasami, ale nie ogólnie”.
Aby to zobaczyć, niech będą zmiennymi losowymi (ze skończonymi wariancjami). Następnie,X1,...,Xn
Teraz zauważ, że , co jest jasne, jeśli pomyśl o tym, co robisz, obliczając ręcznie . W związku z tym,(∑ni=1ai)2=∑ni=1∑nj=1aiaj (a1+...+an)⋅(a1+...+an)
podobnie,
więc
z definicji kowariancji.
Teraz dotyczy Czy wariancja sumy jest równa sumie wariancji? :
Jeśli zmienne są nieskorelowane, tak : to znaczy dla , a następniecov(Xi,Xj)=0 i≠j
Jeśli zmienne są skorelowane, nie, nie ogólnie : Załóżmy na przykład, że są dwiema losowymi zmiennymi, z których każda ma wariancję i gdzie . Następnie , więc tożsamość nie powiedzie się.X1,X2 σ2 cov(X1,X2)=ρ 0<ρ<σ2 var(X1+X2)=2(σ2+ρ)≠2σ2
ale jest to możliwe w przypadku niektórych przykładów : Załóżmy że mają macierz kowariancji następnieX1,X2,X3
Dlatego jeśli zmienne są nieskorelowane, wówczas wariancja sumy jest sumą wariancji, ale odwrotnie nie jest ogólnie prawdą.
źródło
Tak więc, jeśli kowariancje średnio wynoszą , co byłoby konsekwencją, gdyby zmienne były nieskorelowane parami lub były niezależne, wówczas wariancja sumy jest sumą wariancji.0
Przykład, w którym nie jest to prawdą: Niech . Niech . Następnie .X 2 = X 1 Var ( X 1 + X 2 ) = Var ( 2 X 1 ) = 4Var(X1)=1 X2=X1 Var(X1+X2)=Var(2X1)=4
źródło
Chciałem tylko dodać bardziej zwięzłą wersję dowodu podanego przez Macro, więc łatwiej jest zobaczyć, co się dzieje.
Zauważ, że ponieważVar(X)=Cov(X,X)
Dla dwóch dowolnych zmiennych losowych mamy:X,Y
Zauważ, że możemy wygenerować wynik dla sumy zmiennych losowych za pomocą prostej indukcji.n
źródło
Tak, jeśli każda para jest nieskorelowana, to prawda.Xi
Zobacz wyjaśnienie na Wikipedii
źródło