Prawdopodobieństwo warunkowe zmiennej ciągłej

12

Załóżmy, że zmienna losowa ma ciągły rozkład jednolity o parametrach 0 i 10 (tj. )UUU(0,10)

Teraz oznaczmy A zdarzenie, które = 5, a B zdarzenie, które jest równe albo albo 6. Według mojego zrozumienia, oba zdarzenia mają zerowe prawdopodobieństwo wystąpienia.UU5

Teraz, jeśli rozważymy obliczenie , nie możemy użyć prawa warunkowego , ponieważ jest równe zero. Jednak moja intuicja mówi mi, że .P(A|B)P(A|B)=P(AB)P(B)P(B)P(A|B)=1/2

Nowicjusz
źródło
2
Co twoja intuicja powie ci, jeśli miał niejednorodnej gęstości ? 0,02 u , u ( 0 , 10 )U0.02u,u(0,10)
Dilip Sarwate
1
@DilipSarwate Moja intuicja powie mi, że odpowiedź jest liczbą nieco niższą niż 0,5
Noob

Odpowiedzi:

9

„Pojęcie warunkowego prawdopodobieństwa w odniesieniu do pojedynczej hipotezy, której prawdopodobieństwo wynosi 0, jest niedopuszczalne”. A. Kołmogorow

Dla ciągłych zmiennych losowych, i Y, powiedzmy, rozkłady warunkowe są zdefiniowane przez właściwość, że odzyskują pierwotną miarę prawdopodobieństwa, to znaczy dla wszystkich mierzalnych zbiorów A B ( X ) , B B ( Y ) , P ( X A , Y B ) = B d P Y ( y ) B d P X | Y ( x |XYAB(X)BB(Y) Oznacza to, że gęstość warunkowa jest definiowana arbitralnie na zbiorach miary zero lub, innymi słowy, że gęstość warunkowa p X | Y ( x | y ) jest zdefiniowaneprawie wszędzie. Ponieważ zbiór { 5 , 6 } ma miarę zerową w stosunku do miary Lebesgue'a, oznacza to, że można zdefiniować zarówno p ( 5 ), jak i p ( 6 ) w absolutnie dowolny sposób, a zatem prawdopodobieństwo P ( U = 5 |

P(XA,YB)=BdPY(y)BdPX|Y(x|y)
pX|Y(x|y){5,6}p(5)p(6) może przyjąć dowolną wartość.
P(U=5|U{5,6})

Nie oznacza to, że nie można zdefiniować gęstości warunkowej za pomocą wzoru stosunku jak w przypadku normalnym dwuwymiarowym, ale po prostu, że gęstość jest zdefiniowana prawie wszędzie dla obu x i y .

f(y|x)=f(x,y)/f(x)
xy

„Szaleje wiele dość bezcelowych argumentów - między innymi kompetentnymi probabilistami - które z tych wyników są„ poprawne ”.” ET Jaynes

Fakt, że argument ograniczający (gdy idzie do zera) w powyższej odpowiedzi wydaje się dawać naturalną i intuicyjną odpowiedź, jest związany z paradoksem Borela . Wybór parametryzacji w limicie ma znaczenie, jak pokazano w poniższym przykładzie, którego używam w swoich klasach licencjackich.ϵ


Weź dwuwymiarową normalną Jaka jest gęstość warunkowa X, biorąc pod uwagę, że X = Y ?

X,Yi.i.d.N(0,1)
XX=Y


Jeśli zaczniemy od gęstości połączenia , odpowiedź „intuicyjna” jest [proporcjonalna do] φ ( x ) 2 . Można to uzyskać, biorąc pod uwagę zmianę zmiennej ( x , t ) = ( x , y - x ) φ ( x ) φ ( t + x ), gdzie T = Y - X ma gęstość φ (φ(x)φ(y)φ(x)2

(x,t)=(x,yx)φ(x)φ(t+x)
T=YX . Stądf(x|t)= φ ( x ) φ ( t + x )φ(t/2)/2 iF(x|t=0)=φ(x)φ(x)
f(x|t)=φ(x)φ(t+x)φ(t/2)/2
dane
f(x|t=0)=φ(x)φ(x)φ(0/2)/2=φ(x)22
Jeśli jednak zamiast tego rozważymy zmianę zmiennej gęstość krańcowa R = Y / X jest gęstością Cauchy'ego ψ ( r ) = 1 / π { 1 + r 2 }, a gęstość warunkowa X
(x,r)=(x,y/x)φ(x)φ(rx)|x|
R=Y/Xψ(r)=1/π{1+r2}X jest f ( x | r ) = φ ( x ) φ ( r x ) | x | × π { 1 + r 2 } Dlatego f ( x | r = 1 ) = π φ ( x ) 2 | x | / 2R
f(x|r)=φ(x)φ(rx)|x|×π{1+r2}
I tu leży „paradoks”: wydarzenia R = 1 i T = 0 są takie same jak X = Y , ale prowadzą one do różnych gęstościach warunkowych na X .
f(x|r=1)=πφ(x)2|x|/2.
R=1T=0X=YX
Xi'an
źródło
2
To jest po prostu źle. Jeśli podejmiesz rygorystyczny kurs teorii prawdopodobieństwa, zobaczysz, że uzależnienie od zdarzeń o wartości zerowej jest możliwe i praktyczne. Rozważmy dwuwymiarową gaussowską. Wszyscy wiedzą, że możesz uzależnić pierwszą zmienną przyjmującą wartość zero, chociaż to zdarzenie ma zerowe prawdopodobieństwo. Zobacz wikipedia. en.wikipedia.org/wiki/…
Yair Daon
5

Oto kontrowersyjna odpowiedź:

Xi'an ma rację, że nie można warunkować zdarzeń z zerowym prawdopodobieństwem. Jednak Yair ma również rację, że gdy zdecydujesz się na proces ograniczający , możesz ocenić prawdopodobieństwo. Problem polega na tym, że istnieje wiele procesów ograniczających, które osiągają pożądany stan.

(1,11)p1p

Zauważ, że wielu statystyk nie akceptuje zasady obojętności. Podoba mi się, ponieważ odzwierciedla moje intuicje. Chociaż nie zawsze jestem pewien, jak go zastosować, może za 50 lat będzie to bardziej powszechne?

Neil G.
źródło
[0,10]506125
@ whuber: Argument przełączania nie działałby dla dystrybucji Cauchy'ego, chyba że zmieniłeś tryb.
Neil G
Jasne, że tak: istnieje wiele sposobów na przekształcenie jednego ciągłego rozkładu w drugi, który zamienia dwie wartości. W rzeczywistości twoje „odwracanie” nawet nie zachowało oryginalnej dystrybucji. (Całkowicie zmieniło to wsparcie). Wygląda więc na to, że wszystko, co robisz, to zastępujesz jedną dystrybucję inną. Wydaje się, że nie ma tu żadnej zasady.
whuber
@ whuber: zastąpił jedną dystrybucję inną, przez co jednolite obszary wokół 5 i 6 pozostały niezmienione - w ten sam sposób myślę, że pomniejszenie próbuje pozostawić niezmienione gęstości w pierwotnych kręgach w paradoksie Bertranda .
Neil G
1
@whuber: Masz rację. Naprawdę podobała mi się odpowiedź Potato na jedno z moich pytań. Osobiście uważam, że jeśli istnieje rozbieżność między teorią a intuicją, powinniśmy szukać nowych, pełniejszych teorii. Może „zasada obojętności” nie jest całkiem słuszna lub ogólnie nie jest wykonalna, ale naturalnie pragnę, aby teoria prawdopodobieństwa odpowiadała na pytania, na które rozumiemy intuicyjnie. Może Lebesgue miał taki sam niepokój związany z integracją Riemanna, kiedy stworzył swoją całkę?
Neil G
1

A=[5ϵ2,5+ϵ2]B=[5ϵ4,5+ϵ4][6ϵ4,6+ϵ4]ϵ0

Pozwolę sobie raz jeszcze podkreślić (i znowu), że powyższa metoda służy intuicji. Uzależnienie od zdarzeń o zerowym prawdopodobieństwie odbywa się bardzo często bez większego przemyślenia. Najlepszym przykładem, jaki mogę wymyślić, jest to, czy (X1,X2)N(0,Σ)X1X2=0P(ξ=a)=0

Tak, możesz nadać sens warunkowaniu na zdarzeniach o wartości zero.

Yair Daon
źródło
5
UU[0,10]010A={0}B={0,6}P(A|B)=1/2[0,10]1/3500
2
εP(A|B)=P(AB)P(B)=5ε45+ε4f(u)du5ε45+ε4f(u)du+6ε46+ε4f(u)du=ε2ε2+ε2=0.5
3
[5ε8,5+ε8]18
4
Znakomicie intuicyjnie pokazuje, że nie ma unikalnej odpowiedzi: jest to podstawa wypowiedzi Kołmogorowa cytowanej przez @ Xi'ana. Fakt, że musiałeś zmienić procedurę, aby wszystko wyszło na jaw, tak jak myślałeś, że powinny one ostrzec cię o problemach z tym podejściem.
Whuber
3
X2X1X2X1=0