Czy twierdzenie Bayesa dotyczy oczekiwań?

18

Czy to prawda, że dla dwóch zmiennych losowych i ,B.AB

E(AB)=E(BA)E(A)E(B)?
tomka
źródło
3
Hmm ... Nie sądzę, aby te dwie strony były równoważne
Jon
6
Jak wskazano w odpowiedziach, pytanie jest probabilistycznie pozbawione znaczenia ze względu na integrację zmiennych losowych po jednej stronie, które są zmiennymi warunkującymi po drugiej stronie.
Xi'an

Odpowiedzi:

25

(1)E[AB]=?E[BA]E[A]E[B]
Przypuszczalny wynik jest trywialnie prawdziwy dla niezależnych zmiennych losowych A i B z niezerowymi środkami.(1)AB

Jeśli E[B]=0 , to prawa strona (1) obejmuje dzielenie przez 0 a zatem (1) jest bez znaczenia. Należy pamiętać, że to, czy A i B są niezależne, nie ma znaczenia.

Ogólnie rzecz biorąc , (1) nie dotyczy zależnych zmiennych losowych, ale można znaleźć konkretne przykłady zależnych A i B spełniających (1) . Zauważ, że musimy nadal nalegać, aby E[B]0 , w przeciwnym razie prawa strona (1) jest bez znaczenia. Należy pamiętać, że E[AB] jest zmienną losową , która okazuje się być funkcją zmiennej losowej B , np g(B) , a E[BA] jest zmienną losową , która jest funkcją z powiedzmy zmienna losowa Ah(A) . Zatem (1) jest podobne do pytania, czy

(2)g(B)=?h(A)E[A]E[B]
może być prawdziwym stwierdzeniem i oczywiście odpowiedź jest taka, że g(B) nie może być wielokrotność h(A) ogólnie.

O ile mi wiadomo, są tylko dwa specjalne przypadki, w których (1) może się utrzymywać.

  • Jak wspomniano powyżej, dla niezależnych zmiennych losowych i , i są zdegenerowane zmiennych losowych (zwane stałe statystycznie nieobytymi ludzi), które równy oraz odpowiednio, i jeżeli , mamy równość w .B g ( B ) h ( A ) E [ A ] E [ B ] E [ B ] 0 ( 1 )ABg(B)h(A)E[A]E[B]E[B]0(1)

  • Na drugim końcu spektrum od niezależności załóżmy, że gdzie jest funkcją odwracalną, a zatem i są całkowicie zależne zmienne losowe. W tym przypadku i tak staje się który zachowuje się dokładnie, gdy gdzie może być dowolna niezerowa liczba rzeczywista. Tak więc ilekroć jest skalarną wielokrotnością , i oczywiścieg ( ) A = g ( B ) B = g - 1 ( A ) E [ A B ] = g ( B ) ,A=g(B)g()A=g(B)B=g1(A)( 1 ) g ( B ) ? = B E [ A ]

    mi[ZAb]=sol(b),mi[bZA]=sol-1(ZA)=sol-1(sol(b))=b
    (1) g(x)=αxα(1)ABE[B]g(x)(1)g(x)=αx+ββ0Bαβ0A=αB+βB(1)
    sol(b)=?bmi[ZA]mi[b]
    g(x)=αxα(1)ABE[B]musi być niezerowe (por . odpowiedź Michaela Hardy'ego ). Z powyższego wynika, że rozwój musi być liniowa funkcja a nie może zawierać do afinicznej funkcji z . Należy jednak zauważyć, że Alecos Papadopolous w swojej odpowiedzi i komentarzach później twierdzi, że jeśli jest normalną zmienną losową o niezerowej średniej, to dla określonych wartości i , które podaje, i spełniająg(x)(1)g(x)=αx+ββ0Bαβ0A=αB+βB(1) . Moim zdaniem jego przykład jest niepoprawny.

W komentarzu do tej odpowiedzi, Huber zasugerował rozważa symetrycznego domniemanym równość która od Oczywiście, zawsze posiada dla niezależnych zmiennych losowych, niezależnie od wartości oraz oraz dla skalarnych wielokrotności również. Oczywiście w bardziej trywialny sposób dotyczy dowolnych zerowych zmiennych losowych i (niezależnych lub zależnych, wielokrotności skalarnej lub nie; to nie ma znaczenia!): jest wystarczające dla równości w . Zatem może nie być tak interesujący jak E[A]E[B]A=αB(3)ABE[A]=E[B]=0(3)(3)(1)

(3)E[AB]E[B]=?E[BA]E[A]
E[A]E[B]A=αB(3) ABE[A]=E[B]=0 (3)(3)(1) jako temat do dyskusji.
Dilip Sarwate
źródło
9
+1. Aby być hojnym, pytanie można interpretować jako pytanie, czy , gdzie znika pytanie o dzielenie przez zero. E(A|B)E(B)=E(B|A)E(A)
whuber
1
@whuber Dzięki. Moja edycja odnosi się do bardziej ogólnego pytania, czy możliwe jest posiadanie . E[AB]E[B]=E[BA]E[A]
Dilip Sarwate
11

Wynik jest ogólnie nieprawdziwy, zobaczmy to w prostym przykładzie. Niech ma rozkład dwumianowy z parametrami a ma rozkład beta z parametrami , czyli model bayesowski z koniugatem wcześniejszym. Teraz wystarczy obliczyć dwie strony formuły, lewa strona to , podczas gdy prawa strona to i te z pewnością nie są równe.n , p P ( α , β ) E X P = n P E ( P X ) E XXP=pn,pP(α,β)EXP=nP

E(PX)EXEP=α+Xn+α+βα/(α+β)nα/(α+β)
kjetil b halvorsen
źródło
2

Warunkowa oczekiwana wartość zmiennej losowej biorąc pod uwagę zdarzenie, że jest liczbą, która zależy od liczby . Nazwij toNastępnie warunkowego wartość oczekiwana jest losowym, którego wartość jest w pełni określona przez wartość zmiennej losowej . Zatem jest funkcją i jest funkcją .B = b b h ( b ) . E ( A B ) h ( B ) , B E ( A B ) B E ( B A ) AAB=bbh(b).E(AB)h(B),BE(AB)BE(BA)A

Iloraz nazwa nazwa to tylko liczba.E(A)/E(B)

Tak więc jedna strona proponowanej równości jest określona przez a druga przez , więc ogólnie nie mogą być równe.B.AB

(Być może powinienem dodać, że mogą być one równe w trywialnym przypadku, gdy wartości i określają się nawzajem, na przykład gdy i , gdy Ale funkcje równe sobie tylko w kilku punktach nie są równe.)ABA=αB,α0E[B]0

E[AB]=αB=E[BA]α=E[BA]αE[B]E[B]=E[BA]E[A]E[B].
Michael Hardy
źródło
Masz na myśli, że niekoniecznie są one równe? Mam na myśli, że mogą być równe?
BCLC,
1
@BCLC: Są równe tylko w trywialnych przypadkach. A dwie funkcje są sobie równe w niektórych punktach, a nie w innych, nie są równe.
Michael Hardy
2
„Ale tylko w tym trywialnym przypadku mogą być one równe” (podkreślenie dodane) nie jest całkiem poprawne. Rozważ niezależne i B z E [ B ] 0 . Następnie E [ A B ] = E [ A ], podczas gdy E [ B A ] = E [ B ], a więc E [ B A ] E [ A ]ABE[B]0E[AB]=E[A]E[BA]=E[B]
E[BA]E[A]E[B]=E[B]E[A]E[B]=E[A]=E[AB].
Dilip Sarwate,
@DilipSarwate Już miałem powiedzieć, że haha!
BCLC,
Zredagowałem twoją odpowiedź, aby dodać kilka szczegółów dla sprawy, którą wskazałeś. Cofnij zmiany, jeśli nie podobają Ci się zmiany.
Dilip Sarwate
-1

Wyrażenie to z pewnością nie obowiązuje w ogóle. Dla zabawy pokazuję poniżej, że jeśli i B wspólnie podążają dwuwymiarowym rozkładem normalnym i mają niezerowe średnie, wynik zostanie zachowany, jeśli dwie zmienne są funkcjami liniowymi i mają ten sam współczynnik zmienności ( stosunek odchylenia standardowego do średniej) w wartościach bezwzględnych.AB

Dla wspólnych normalnych mamy

E(AB)=μA+ρσAσB(BμB)

i chcemy narzucić

μA+ρσAσB(BμB)=[μB+ρσBσA(AμA)]μAμB

μA+ρσAσB(BμB)=μA+ρσBσAμAμB(AμA)

Uprość a następnie ρ , i przearanżuj, aby uzyskaćμAρ

B=μB+σB2σA2μAμB(AμA)

Jest to więc relacja liniowa między tymi dwiema zmiennymi (więc są one z pewnością zależne, ze współczynnikiem korelacji równym jedności w wartościach bezwzględnych), aby uzyskać pożądaną równość. Co to oznacza?

Po pierwsze, musi być również spełnione

E(B)μB=μB+σB2σA2μAμB(E(A)μA)μB=μB

więc na (lub A ) nie nakłada się żadnych innych ograniczeń, z wyjątkiem tego, że są one niezerowe. Również relacja dla wariancji musi być spełniona,BA

Var(B)σB2=(σB2σA2μAμB)2Var(A)

(σA2)2σB2=(σB2)2σA2(μAμB)2

(σAμA)2=(σBμB)2(cvA)2=(cvB)2

|cvA|=|cvB|

który miał być pokazany.

Należy zauważyć, że równość współczynnika zmienności w wartościach bezwzględnych pozwala zmiennym na różne wariancje, a także na jedną dodatnią średnią, a drugą ujemną.

Alecos Papadopoulos
źródło
1
Czy to nie jest skomplikowana droga do gdzie α to jakiś skalar? A=αBα
Matthew Gunn
1
@MatthewGunn Twój komentarz jest odpowiedni do celu. Normalność nie ma nic wspólnego z tą sprawą. Dla zmiennych losowych i B , tak że = α B , E [ | B ] = α B = i podobnie, E [ B | ] = B . W związku z tym, zakładając, że E [ B ] 0 , E [ A B ] = α B = EABA=αBE[AB]=αB=AE[BA]=BE[B]0
E[AB]=αB=E[BA]α=E[BA]αE[B]E[B]=E[BA]E[A]E[B].
|cvA|=|cvB|
aVarXaVar(X)aVarXaVar(X). That's why the latter is standard usage.
Michael Hardy
@MatthewGun It seems to me that providing answers that contain specific examples is considered valuable content in this site. So yes, when a random variable is an affine function of another, and they are jointly normal with non-zero means, then one needs to have equal coefficients of variation, while, also there are no restrictions on the means of these rv's. On the other hand, when a random variable is just a linear function of another, the relation holds always. So no my answer is not a convoluted way to say A=aB. (cc:@DilipSarwate)
Alecos Papadopoulos
2
If B is a non-normal random variable with E[B]=μB0 and A=cB+d (and so B=Adc), then
E[AB]=cB+d=A,E[BA]=Adc=B.
Now, if we want to have E[AB]=cB+d to equal E[BA]μAμB=BμAμB, it must be that
cB+d=BμAμBd=0,c=μAμB
and so A=cB=μAμBB. So, for nonnormal B, the OP's conjectured result holds if A=cB but not if A=cB+d,d0.Of course, as you have proved, the result holds for normal random variables if A=cB+d,d0 .
Dilip Sarwate