Jakie jest prawdopodobieństwo, że

10

Załóżmy, że X i Y są dwuwymiarowe normalne ze średnią μ=(μ1,μ2) i kowariancją Σ=[σ11σ12σ12σ22] . Jakie jest prawdopodobieństwo Pr(X<Y|min(X,Y)) ?

mikrofon
źródło
@ Whuber właśnie dzięki, usunąłem moje myśli, ponieważ nic tu nie dodają.
AdamO,
1
Pr(m<Y|X=m)Pr(m<Y|X=m)+Pr(m<X|Y=m)
Sextus Empiricus
przydatny link stats.stackexchange.com/questions/30588/… Czy to pytanie do samodzielnej nauki?
Sextus Empiricus
Powinieneś podzielić się swoimi przemyśleniami na temat problemu, niezależnie od tego, że wygląda to na pytanie do samodzielnej nauki.
StubbornAtom

Odpowiedzi:

7

Używając nieco bardziej wyraźnego zapisu , gdzie jest liczbą rzeczywistą, a nie zmienną losową. Zbiór, w którym jest ścieżką w kształcie litery L z dwoma półotwartymi segmentami: jeden biegnie prosto w górę od punktu a drugi idzie prosto w prawo od tego samego punktu. Oczywiste jest, że na nodze pionowej i na nodze poziomej .m min ( X , Y ) = m ( m , m ) x < y x > yP(X<Y|min(X,Y)=m)mmin(X,Y)=m(m,m)x<yx>y

mu1 = 0, mu2 = 2, sigma 11 = 0,5, sigma22 = 1, sigma12 = 0,2, m = 1

Biorąc pod uwagę tę geometryczną intuicję, łatwo przepisać problem w równoważnej formie, gdzie w liczniku mamy tylko nogę pionową, gdzie a w mianowniku mamy sumę dwóch nóg.x<y

(1)P(X<Y|min(X,Y))=P(m<Y|X=m)P(m<Y|X=m)+P(m<X|Y=m)

Teraz musimy obliczyć dwa wyrażenia postaci . Takie warunkowe prawdopodobieństwa dwuwymiarowego rozkładu normalnego zawsze mają rozkład normalny z parametrami:N ( μ X | Y = m , s 2 X | Y = m )P(m<X|Y=m)N(μX|Y=m,sX|Y=m2)

(2)μX|Y=m=μ1+σ12σ22(mμ2)

(3)sX|Y=m2=σ11σ122σ22

Zauważ, że w oryginalnej definicji problemu odnosiło się do elementów macierzy kowariancji, w przeciwieństwie do bardziej powszechnej konwencji używania dla odchylenia standardowego. Poniżej znajdziemy go bardziej wygodne w użyciu dla wariancji i dla odchylenia standardowego rozkład warunkowy. σ s 2 sσijσs2s

Znając te dwa parametry, możemy obliczyć prawdopodobieństwo niż na podstawie funkcji rozkładu skumulowanego.m<X

(4)P(m<X|Y=m)=Φ(μX;Y=mmsX;Y=m)

mutatis mutandis , mamy podobne wyrażenie dla . PozwolićP(Y>m|X=m)

(5)zX|Y=m=μX;Y=mmsX;Y=m

i

(6)zY|X=m=μY;X=mmsY;X=m

Wtedy możemy pisać zwięźle kompletne rozwiązanie w zakresie tych dwóch wynikami:z

(7)P(X<Y|min(X,Y)=m)=1Φ(zX|Y=m)Φ(zX|Y=m)+Φ(zY|X=m)

Na podstawie kodu symulacji dostarczonego przez autora pytania możemy porównać ten wynik teoretyczny z wynikami symulowanymi:

wprowadź opis zdjęcia tutaj

olooney
źródło
W (3) myślę, że lewa strona powinna mieć kwadrat, ponieważ jest to wariancja warunkowa, podczas gdy odchylenie standardowe jest używane później.
Yves
Masz całkowitą rację @Yves i uważam, że moje ostatnie zmiany naprawiły ten problem. Dziękuję Ci.
olooney,
@olooney, dziękuję za tę odpowiedź. Mogę śledzić pochodną i wydaje się poprawna. Próbowałem jednak zweryfikować (1) i (7) w symulacji, a wyniki były całkiem inne. Możesz zobaczyć mój kod R tutaj gist.github.com/mikeguggis/d041df05565f63f8be2c6c51f5cf8961
mike
@mike, myślę, że wystąpił błąd znaku. Po ustaleniu tego wynik teoretyczny wydaje się zgadzać z wynikami symulacji. gist.github.com/olooney/e88a66d2d2fa7f2f0cd0d0dd6b708739
olooney
@olooney, dobry połów. Nadal nie jestem w stanie zrozumieć, dlaczego dwie szacunki oparte na symulacji nie pasują (wiersze 30–32 w moim kodzie).
Mike
1

Pytanie można przepisać, używając zmodyfikowanej wersji twierdzenia Bayesa (i nadużycia pojęcia dla )Pr

Pr(X<Y|min(X,Y)=m)=Pr(min(X,Y)=m|X<Y)Pr(X<Y)Pr(min(X,Y)=m|X<Y)Pr(X<Y)+Pr(min(X,Y)=m|XY)Pr(XY)=Pr(X<Y,min(X,Y)=m)Pr(X<Y,min(X,Y)=m)+Pr(XY,min(X,Y)=m).

Zdefiniuj jako dwuwymiarowy plik PDF i , i . NastępniefX,YXYϕ(x)=12πexp(12x2)Φ(x)=xϕ(t)dt

Pr(X<Y,min(X,Y)=m)=Pr(X=m,Y>m)=mfX,Y(m,t)dt

i

Pr(XY,min(X,Y)=m)=Pr(Xm,Y=m)=mfX,Y(t,m)dt

Używając normalności i definicji prawdopodobieństwa warunkowego, całki można przepisać jako

fX,Y(m,t)=fY|X(t)fX(m)=1σY|Xϕ(tμY|XσY|X)1σ11ϕ(mμ1σ11)

i

fX,Y(t,m)=fX|Y(t)fY(m)=1σX|Yϕ(tμX|YσX|Y)1σ22ϕ(mμ2σ22).

Gdzie

μX|Y=μ1+σ12σ22(mμ2),

μY|X=μ2+σ12σ11(mμ1),

σX|Y=(1σ122σ11σ22)σ11

i

σY|X=(1σ122σ11σ22)σ22.

A zatem

Pr(X<Y|min(X,Y)=m)=(1Φ(mμY|XσY|X))1σ11ϕ(mμ1σ11)(1Φ(mμY|XσY|X))1σ11ϕ(mμ1σ11)+(1Φ(mμX|YσX|Y))1σ22ϕ(mμ2σ22).

Ta ostateczna forma jest bardzo podobna do wyniku, jaki uzyskał @olooney. Różnica polega na tym, że jego prawdopodobieństwa nie są ważone przez normalne gęstości.

Skrypt R do weryfikacji numerycznej można znaleźć tutaj

mikrofon
źródło