Wariancja funkcji jednej zmiennej losowej

33

Powiedzmy, że mamy losową zmienną X o znanej wariancji i średniej. Pytanie brzmi: jaka jest wariancja f(X) dla danej funkcji f. Jedyną ogólną metodą, o której wiem, jest metoda delta, ale daje ona jedynie przybliżenie. Teraz interesuje mnie f(x)=x , ale byłoby miło poznać kilka ogólnych metod.

Edytuj 29.12.2010
Przeprowadziłem kilka obliczeń przy użyciu serii Taylora, ale nie jestem pewien, czy są one poprawne, więc byłbym szczęśliwy, gdyby ktoś mógł je potwierdzić .

E[f(X)]
E[f(X)]E[f(μ)+f(μ)(Xμ)+12f(μ)(Xμ)2]=f(μ)+12f(μ)Var[X]

Teraz możemy w przybliżeniuD2[f(X)]
E[(f(X)E[f(X)])2]E[(f(μ)+f(μ)(Xμ)+12f(μ)(Xμ)2E[f(X)])2]

Korzystając z aproksymacji wiemy, żef ( μ ) - E f ( x ) - 1E[f(X)]f(μ)Ef(x)12f(μ)Var[X]

Za pomocą tego otrzymujemy:
D2[f(X)]1D2[f(X)]14f(μ)2Var[X]212f(μ)2Var[X]2+f(μ)2Var[X]+14f(μ)2E[(Xμ)4]+12f(μ)f(μ)E[(Xμ)3]
D2[f(X)]14f(μ)2[D4X(D2X)2]+f(μ)D2X+12f(μ)f(μ)D3X

Tomek Tarczyński
źródło
Metoda delta jest stosowana do rozkładów asymptotycznych. Nie możesz użyć, jeśli masz tylko jedną zmienną losową.
mpiktas
@mpiktas: Właściwie nie wiem dużo o metodzie Delta, właśnie przeczytałem coś na wikipedii. Cytat z wiki: „Metoda delta wykorzystuje rozszerzenia Taylora drugiego rzędu do przybliżenia wariancji funkcji jednej lub więcej zmiennych losowych”.
Tomek Tarczyński
wygląda na to, że wikipedia ma dokładnie to, czego chcesz: en.wikipedia.org/wiki/… . Ponownie zredaguję swoją odpowiedź, wygląda na to, że nie doceniłem rozszerzenia Taylora.
mpiktas
Tomku, jeśli nie zgadzasz się z wprowadzonymi zmianami (nie przeze mnie), zawsze możesz je zmienić ponownie, wycofać lub po prostu wskazać różnice i poprosić o wyjaśnienia.
Glen_b
2
@Glen_b: Zgadzam się z nimi E (X-mu) = 0 nie oznacza, że ​​E [(X-mu) ^ 3] = 0.
Tomek Tarczyński

Odpowiedzi:

33

Aktualizacja

Nie doceniłem rozszerzeń Taylora. Oni faktycznie działają. Zakładałem, że całka pozostałego terminu może być nieograniczona, ale przy odrobinie pracy można wykazać, że tak nie jest.

Rozszerzenie Taylora działa dla funkcji w ograniczonym zamkniętym przedziale. Dla zmiennych losowych o skończonej wariancji daje nierówność Czebyszewa

P(|XEX|>c)Var(X)c

Tak więc dla każdego możemy znaleźć wystarczająco duże c , abyε>0c

P(X[EXc,EX+c])=P(|XEX|c)<1ε

Najpierw oszacujmy . Mamy E f ( X ) = | x - E X | c f ( x ) d F ( x ) + | x - E X | > c f ( x ) d F ( x ) gdzie F ( x ) jest funkcją rozkładu dlaEf(X)

Ef(X)=|xEX|cf(x)dF(x)+|xEX|>cf(x)dF(x)
F(x) .X

Ponieważ domeną pierwszej całki jest przedział który jest ograniczonym przedziałem zamkniętym, możemy zastosować rozszerzenie Taylora: f ( x ) = f ( E X ) + f ( E X ) ( x - E X ) + f ([EXc,EX+c] gdzieα[EX-c,EX+c], a równość obowiązuje dla wszystkichx[EX-c,EX+c]

f(x)=f(EX)+f(EX)(xEX)+f(EX)2(xEX)2+f(α)3(xEX)3
α[EXc,EX+c]x[EXc,EX+c] . W rozszerzeniu Taylora wziąłem tylko 4 terminy, ale ogólnie możemy wziąć tyle, ile chcemy, pod warunkiem, że funkcja jest wystarczająco płynna.f

Zastępując tę ​​formułę poprzednią otrzymujemy

Teraz możemy zwiększyć domenę integracji, aby uzyskać następującą formułę

Ef(X)=|xEX|cf(EX)+f(EX)(xEX)+f(EX)2(xEX)2dF(x)+|xEX|cf(α)3(xEX)3dF(x)+|xEX|>cf(x)dF(x)

Ef(X)=f(EX)+f(EX)2E(XEX)2+R3
gdzie
R3=f(α)3E(XEX)3++|xEX|>c(f(EX)+f(EX)(xEX)+f(EX)2(xEX)2+f(X))dF(x)
P(|XEX|>c)E(XEX)3fE(XEX)3=0

f(x)Ef(x)

E(f(x)Ef(x))2=(f(EX))2Var(X)+T3

T3E(XEX)kk=4,5,6

f2(x)

f2(x)=f2(EX)+2f(EX)f(EX)(xEX)+[(f(EX))2+f(EX)f(EX)](XEX)2+(f2(β))3(XEX)3

Ef2(x)=f2(EX)+[(f(EX))2+f(EX)f(EX)]Var(X)+R~3
R~3R3

Var(f(X))=[f(EX)]2Var(X)[f(EX)]24Var2(X)+T~3
T~3
mpiktas
źródło
Nie muszę znać dokładnej wartości wariancji, przybliżenie powinno dla mnie działać.
Tomek Tarczyński
Rzeczywiście, przybliżona formuła dla mi[fa(X)]w PO jest często stosowany w analizie ryzyka w ekonomii, finansach i ubezpieczeniach.
Raskolnikov
@Raskolnikov, tak, ale jest to sprzeczne z moją, jak się zdaje, złą znajomością ekspansji Taylora. Oczywiście należy wziąć pod uwagę pozostałą część terminu. Jeśli zmienna losowa jest ograniczona, nie ma problemu, ponieważ wielomiany aproksymują funkcje ciągłe w ograniczonym przedziale równomiernie. Ale mamy do czynienia z nieograniczonymi losowymi zmiennymi. Oczywiście dla losowej normalnej możemy powiedzieć, że jest skutecznie ograniczona, ale nadal w ogólnym przypadku mogą pojawić się jakieś nieprzyjemne niespodzianki, lub nie. Naprawię swoją odpowiedź, kiedy będę miał jasną odpowiedź.
mpiktas
2
@Tomek Tarczyński, trzecia pochodna x dla dużych dość szybko spada do zera x, ale jest nieograniczona w pobliżu zera. Jeśli więc wybierzesz rozkład równomierny ze wsparciem bliskim zera, pozostały okres może stać się duży.
mpiktas,
1
Pamiętaj, że w twoim linku równość jest przybliżona. W tej odpowiedzi wszystkie równania są dokładne. Ponadto w odniesieniu do wariancji należy zauważyć, że pierwszą pochodną szacuje się na poziomiemiX, nie x. Nigdy też nie powiedziałem, że to nie zadziałax, tylko to dla x przybliżona formuła może mieć ogromny błąd, jeśli Xdomena jest bliska zeru.
mpiktas
8

Znajomość pierwszych dwóch momentów X (średnia i wariancja) nie wystarczy, jeśli funkcja f (x) jest dowolna (nieliniowa). Nie tylko do obliczania wariancji transformowanej zmiennej Y, ale także dla jej średniej. Aby to zobaczyć - i być może zaatakować twój problem - możesz założyć, że twoja funkcja transformacji ma rozszerzenie Taylora wokół średniej X i działa od tego momentu.

leonbloy
źródło