Korelacja między X i XY

11

Jeśli mam dwie niezależne zmienne losowe X i Y, jaka jest korelacja między X a iloczynem XY? Jeśli to nie jest znane, chciałbym wiedzieć przynajmniej, co dzieje się w konkretnym przypadku, gdy X i Y są normalne z zerową średnią, jeśli łatwiej to rozwiązać.

Roberto
źródło
4
Co motywuje to pytanie? Zastanawiam się, czy byłoby najlepiej, gdybyśmy zajęli się także czymś innym. Czy z jakiegoś powodu przeprowadzasz badanie, w którym utworzyłeś zmienną XY?
Gung - Przywróć Monikę

Odpowiedzi:

13

Rozwiązanie

Rozumiem, że poprawnym rozwiązaniem będzie taki, który wyraża - jeśli to możliwe - korelacja w zakresie odrębnych właściwości zmiennych i Y . Obliczanie korelacji będzie obejmować obliczanie kowariancje jednomianów w X i Y . Wykonanie tego naraz jest opłacalne. Po prostu to obserwujXYXY

  1. Gdy i Y są niezależne, a i i j są potęgami, wówczas X i i Y j są niezależne;XYijXiYj

  2. Oczekiwanie na iloczyn zmiennych niezależnych jest iloczynem ich oczekiwań.

To daje formuł w zakresie momentów i Y .XY

To wszystko.


Detale

Napisz itd. Dla chwil. Zatem dla dowolnych liczb i , j , k , l, dla których obliczenia mają sens i dają liczby skończone,μi(X)=E(Xi)i,j,k,l

Cov(XiYj,XkYl)=E(XiYjXkYl)E(XiYj)E(XkYl)=μi+k(X)μj+l(Y)μi(X)μk(X)μj(Y)μl(Y).

Zauważ, że wariancją dowolnej zmiennej losowej jest jej kowariancja względem siebie, więc nie musimy wykonywać żadnych specjalnych obliczeń dla wariancji.

Teraz powinno być oczywiste, jak obliczyć momenty obejmujące monomale, dowolnej mocy, dowolnej skończonej liczby niezależnych zmiennych losowych. Jako wniosek zastosuj ten wynik do definicji korelacji, która jest kowariancją podzieloną przez pierwiastki kwadratowe wariancji:

Cor(X,XY)=Cov(X1Y0,X1Y1)Cov(X1Y0,X1Y0) Cov(X1Y1,X1Y1)=μ2(X)μ1(Y)μ1(X)2μ1(Y)(μ2(X)μ1(X)2)(μ2(X)μ2(Y)μ1(X)2μ2(Y)2).

Istnieją różne uproszczenia algebraiczne, które możesz wybrać, jeśli chcesz powiązać to z oczekiwaniami, wariancjami i kowariancjami oryginalnych zmiennych, ale ich wykonanie tutaj nie zapewniłoby więcej wglądu.

Whuber
źródło
14

XY

Cov(X,XY)=ECov(X,XY|Y)+Cov(EX|Y,EXY|Y)=E(YCov(X,X))+Cov(EX,YEX)=E(YVarX)+Cov(EX,YEX)=EYVarX.
Var(XY)=EVar(XY|Y)+VarE(XY|Y)=E(Y2(VarX|Y))+Var(Y(EX|Y))=E(Y2VarX)+Var(YEX)=E(Y2)VarX+(EX)2VarY=VarXVarY+(EY)2VarX+(EX)2VarY.
Y

corr(X,XY)=11+VarY(EY)2(1+(EX)2VarX).

Sprawdzenie tego wyniku przez symulację:

> n <- 1e+6
> x <- rexp(n,2)-2
> y <- rnorm(n,mean=5)
> cv2 <- function(x) var(x)/mean(x)^2
> 1/sqrt(1+cv2(y)*(1+1/cv2(x)))
[1] 0.844882
> cor(x,x*y)
[1] 0.8445373
Jarle Tufto
źródło
E(Y2VarX)+Var(YEX)ECov(X,XY|Y)=EYCov(X,X)Yjest dane. Sugerowałbym minimalne wyjaśnienie niektórych kroków.
Antoni Parellada,
1
Tak, dodałem trochę nawiasów i wyjaśnienia. Muszę jednak przyznać, że wolę odpowiedź @whuber.
Jarle Tufto
5

ρ(XY,X)=0E(X2Y)=E[E[X2Y|X]]=E[X2E[Y|X]]=0cov(XY,X)=E(X2Y)E(XY).E(X)=0

Kledou
źródło
-2

Korelacja liniowa między X i XY będzie wynosić,

Corr (X, XY) = Cov (X, XY) / sqrt (var (X) * var (XY))

Cov (X, XY) = Sumowanie ((X-średnia (X)) (XY-średnia (XY)) / n

n - wielkość próbki; var (X) = wariancja X; var (XY) = wariancja XY

Sam Gladio
źródło
1
Pytanie dotyczy zmiennych losowych , a nie danych.
whuber
jak możemy ustalić, czy 2 zmienne losowe są skorelowane, czy nie? Tylko poprzez dane. Popraw mnie, jeśli się mylę. Przeprosiny.
Sam Gladio,
Oblicza się korelację teoretycznie, używając matematycznych właściwości zmiennych losowych. Jest to prawie to samo, co, powiedzmy, obliczanie siły projektu mostu przy użyciu zasad mechaniki Newtona w porównaniu do budowania mostów i testowania ich: istnieją różne role dla teorii i danych i nie należy ich mylić ze sobą .
whuber