Tytuł jest pytaniem. Powiedziano mi, że stosunki i inwersje zmiennych losowych często stanowią problem. Oznacza to, że oczekiwania często nie istnieją. Czy istnieje proste, ogólne wyjaśnienie tego?
źródło
Tytuł jest pytaniem. Powiedziano mi, że stosunki i inwersje zmiennych losowych często stanowią problem. Oznacza to, że oczekiwania często nie istnieją. Czy istnieje proste, ogólne wyjaśnienie tego?
Chciałbym przedstawić bardzo proste, intuicyjne wyjaśnienie. Sprowadza się do spojrzenia na zdjęcie: reszta tego postu wyjaśnia zdjęcie i wyciąga z niego wnioski.
Oto, co się sprowadza: gdy „masa prawdopodobieństwa” skoncentrowana jest w pobliżu , prawdopodobieństwo będzie zbyt duże w pobliżu , co spowoduje, że jego oczekiwanie będzie niezdefiniowane.
Zamiast być w pełni ogólnym, skupmy się na zmiennych losowych które mają ciągłe gęstości w sąsiedztwie . Załóżmy, że . Wizualnie te warunki oznaczają, że wykres leży powyżej osi wokół :
Ciągłość wokół 0 oznacza, że dla dowolnej dodatniej wysokości p mniejszej niż f X ( 0 ) i wystarczająco małej ϵ , możemy wykroić prostokąt pod tym wykresem, który jest wyśrodkowany wokół x = 0 , ma szerokość 2 ϵ i wysokość p , jak pokazano. Odpowiada to wyrażeniu pierwotnego rozkładu jako mieszaniny równomiernego rozkładu (o wadze p × 2 ϵ = 2 p ϵ ) i wszystkiego, co pozostanie.
Innymi słowy, możemy myśleć o jako powstającym w następujący sposób:
Z prawdopodobieństwem draw wartość z jednolitej ( - ε , ε ) dystrybucji.
W przeciwnym razie narysuj wartość z rozkładu, którego gęstość jest proporcjonalna do . (Jest to funkcja narysowana na żółto po prawej stronie).
( jest funkcją wskaźnika).
Etap pokazuje, że dla każdej 0 < u < ε , prawdopodobieństwo, że x wynosi 0 i U przekracza s U / 2 . Równolegle jest to szansa, że 1 / X przekroczy 1 / u . Innymi słowy: napisanie S dla funkcji przeżycia 1 / X
obrazek pokazuje dla wszystkich .x > 1 / ϵ
Skończyliśmy teraz, ponieważ ten fakt dotyczący sugeruje, że oczekiwanie jest nieokreślone. Porównaj całki zaangażowane w obliczanie oczekiwanej dodatniej części , :( 1 / X ) + = max ( 0 , 1 / X )
(Jest to argument czysto geometryczny: każda całka reprezentuje możliwy do zidentyfikowania dwuwymiarowy region, a wszystkie nierówności wynikają z ścisłych wtrąceń w tych obszarach. Rzeczywiście, nie musimy nawet wiedzieć, że ostateczna całka jest logarytmem: istnieją proste geometryczne argumenty wskazujące na tę całkowitą rozbieżność).
Ponieważ prawa strona różni się jako , różni. Sytuacja z ujemną częścią jest taka sama (ponieważ prostokąt jest wyśrodkowany wokół ), a ten sam argument pokazuje oczekiwanie, że ujemna część rozbieżna. W związku z tym oczekiwanie samego jest niezdefiniowane.
Nawiasem mówiąc, takie same przedstawiono argumentów, że gdy jest prawdopodobieństwo skoncentrowane na jednym boku z , takie jak dowolny rozkład wykładniczy lub gamma (parametr kształtu mniejszy niż ), a następnie jeszcze pozytywne rozbieżna oczekiwania, ale oczekiwana ujemny wynosi zero. W tym przypadku oczekiwanie jest zdefiniowane, ale jest nieskończone.
Stosunki i inwersje są w większości znaczące w przypadku nieujemnych zmiennych losowych, więc prawie na pewno przyjmę . Następnie, jeśli X jest zmienną dyskretną, która przyjmuje wartość zero z prawdopodobieństwem dodatnim, będziemy dzielić z zerą z prawdopodobieństwem dodatnim, co tłumaczy, dlaczego oczekiwanie 1 / X nie istnieje.X≥0 X 1/X
Teraz spójrz na przypadek rozkładu ciągłego, gdzie jest losową zmienną z funkcją gęstości f ( x ) . Zakładamy, że f ( 0 ) > 0 i że f jest ciągłe (co najmniej zero). Następnie jest ϵ > 0 takie, że f ( x ) > ϵ dla 0 ≤ x < ϵ . Oczekiwaną wartość 1 / X podaje E 1X≥0 f(x) f(0)>0 f ϵ>0 f(x)>ϵ 0≤x<ϵ 1/X
Teraz zmieńmy zmienną całkowania na u = 1 / x , mamy d u = - 1
Udzieliliśmy odpowiedzi na odwrotność, a co ze stosunkami? Niech będzie stosunkiem dwóch nieujemnych zmiennych losowych. Jeśli są niezależne, możemy zapisać E Z = E YZ=Y/X
więc prawie wszystko sprowadza się do pierwszego przypadku i nie ma wiele do powiedzenia. Co jeśli są zależne, z faktorowaniem gęstości połączeń jako
f(x,y)=f(x∣y)g(y)
Następnie otrzymujemy (stosując takie samo podstawienie jak powyżej)
EY
źródło