Jak zdefiniować rozkład tak, aby czerpał z niego korelację z losowaniem z innego wcześniej określonego rozkładu?

12

Jak zdefiniować rozkład zmiennej losowej tak, że losowanie z Y ma korelację ρ z x 1 , gdzie x 1 jest pojedynczym losowaniem z rozkładu z funkcją rozkładu skumulowanego F X ( x ) ? YYρx1x1FX(x)

OctaviaQ
źródło

Odpowiedzi:

21

Możesz to zdefiniować za pomocą mechanizmu generowania danych. Na przykład, jeśli iXFX

Y=ρX+1ρ2Z

gdzie i jest niezależne od X , wtedyZFXX

cov(X,Y)=cov(X,ρX)=ρvar(X)

Również zauważyć, że , ponieważ Z jest taki sam jak rozkład X . W związku z tym,var(Y)=var(X)ZX

cor(X,Y)=cov(X,Y)var(X)2=ρ

Więc jeśli można wygenerować dane z , można wygenerować variate, Y , który ma określoną korelację ( p ) z X . Należy jednak zauważyć, że krańcowy rozkład Y będzie F X tylko w szczególnym przypadku, gdy F X jest rozkładem normalnym (lub innym rozkładem addytywnym). Wynika to z faktu, że sumy zmiennych normalnie rozłożonych są normalne; nie jest to ogólna właściwość dystrybucji. W ogólnym przypadku będziesz musiał obliczyć rozkład Y , obliczając (odpowiednio skalowane) splot gęstości odpowiadający FFXY(ρ)XYFXFXY z samym sobą.FX

Makro
źródło
2
+1 Bardzo ładna odpowiedź. Nitpick: w ostatnim wierszu trzeba convolve skalowane wersje z . FX
whuber
Wielkie dzięki, Makro. Żeby coś wyjaśnić - masz na myśli w ostatnim akapicie, że musiałbyś splot rho * X z sqrt (1 - rho ^ 2) * X? (przepraszam, nie udało mi się uzyskać żadnego formatowania, nawet HTML do pracy w tym konkretnym komentarzu)
OctaviaQ
1
ρX1ρ2X
1
Dawno, ale ... pomysły, jak to zrobić, wymuszając również marginalną dystrybucję Y?
Julián Urbano