Intuicyjne wyjaśnienie udziału w sumie dwóch normalnie rozmieszczonych zmiennych losowych

16

Jeśli mam dwie normalnie rozmieszczone niezależne zmienne losowe i ze średnimi i i odchyleniami standardowymi i i , że , to (zakładając, że nie popełniłem żadnych błędów) rozkład warunkowy od i podanymi są zwykle rozprowadzane w środki i odchylenie standardowe Y μ X μ Y σ X σ Y X + Y = C X Y C μ X | c = μ X + ( c - μ X - μ Y ) σ 2 XXYμXμYσXσYX+Y=doXYdo μY| c=μY+(c-μX-μY)σ 2 Y

μX|do=μX+(do-μX-μY)σX2)σX2)+σY2)
σX| c=σY| c=
μY|do=μY+(do-μX-μY)σY2)σX2)+σY2)
σX|do=σY|do=σX2)σY2)σX2)+σY2).

Nic dziwnego, że standardowe odchylenia warunkowe są takie same, jak w przypadku , jeśli jedno wzrośnie, drugie musi spaść o tę samą wartość. Interesujące jest to, że warunkowe odchylenie standardowe nie zależy od c .cdoc

To, czego nie mogę obrócić , to środki warunkowe, w których biorą udział nadwyżki (c - \ mu_X - \ mu_Y)(cμXμY) proporcjonalny do pierwotnych wariancji, a nie do oryginalnych odchyleń standardowych.

Na przykład, jeśli mają zero, μX=μY=0 , a odchylenia standardowe σX=3 i σY=1 a następnie uwarunkowane na c=4 , mielibyśmy E[X|c=4]=3.6 i E[Y|c=4]=0.4 , tj. W stosunku 9:1 chociaż intuicyjnie pomyślałbym, że stosunek 3):1 byłby bardziej naturalny. Czy ktoś może podać intuicyjne wyjaśnienie tego?

Spowodowało to pytanie Math.SE

Henz
źródło

Odpowiedzi:

16

Pytanie łatwo sprowadza się do przypadku , patrząc na i .X - μ X Y - μ YμX=μY=0XμXYμY

Oczywiście rozkład warunkowy jest normalny. Zatem średnia, mediana i tryb każdego z nich są zbieżne. Tryby będą występować na współrzędnych lokalnego maksimum dwuwymiarowego pliku PDF i ograniczonego do krzywej . To implikuje kontur dwuwymiarowego pliku PDF w tym miejscu, a krzywa wiązania ma równoległe styczne. (Jest to teoria mnożników Lagrange'a.) Ponieważ równanie dowolnego konturu ma postać dla jakiejś stałej (to znaczy wszystkie kontury są elipsami), ich gradienty muszą być równoległe, skąd istnieje taka żeXYg(x,y)=x+y=cf(x,y)=x2/(2σX2)+y2/(2σY2)=ρρλ

(xσX2),yσY2))=fa(x,y)=λsol(x,y)=λ(1,1).

wprowadź opis zdjęcia tutaj

Wynika z tego natychmiast, że tryby rozkładów warunkowych (a zatem także średnich) są określone przez stosunek wariancji, a nie SD.

Ta analiza działa również dla skorelowanych i i ma zastosowanie do wszelkich wiązań liniowych, a nie tylko do sumy.XY

Whuber
źródło
To bardzo imponujące i bardziej kompletne, niż się spodziewałem. Byłbym usatysfakcjonowany diagramem i stwierdzeniem, że styczna do elipsy nie przechodzi przez środek elipsy, więc czerwony punkt stycznej musi brać nieproporcjonalnie więcej od zmiennej losowej o wyższym odchyleniu standardowym.
Henry
1
To nie było dobrze sformułowane. Miałem na myśli to, że linia od środka do czerwonego punktu nie jest prostopadła do stycznej.
Henry