Oczekiwana wartość x w rozkładzie normalnym, ZOBACZ, że jest ona poniżej określonej wartości

12

Zastanawiam się tylko, czy można znaleźć oczekiwaną wartość x, jeśli jest ona normalnie rozłożona, biorąc pod uwagę, że jest ona poniżej określonej wartości (na przykład poniżej wartości średniej).

Jaśmin
źródło
Jest to oczywiście możliwe. Jako minimum można obliczyć za pomocą siły brutalnej F(t)1xtf(t)dt . Lub jeśli znasz μ i σ możesz to oszacować za pomocą symulacji.
dsaxton,
@dsaxton W tej formule jest kilka literówek, ale wpadamy na pomysł. Ciekawe, jak dokładnie uruchomiłbyś symulację, gdy próg jest znacznie poniżej średniej.
whuber
1
@ whuber Tak, F(t) powinno być F(x) . Symulacja, gdy F(x) jest bliskie zeru, nie byłaby zbyt mądra , ale jak zauważyłeś, i tak istnieje dokładna formuła.
dsaxton,
@dsaxton OK, wystarczy. Miałem tylko nadzieję, że masz na myśli jakiś sprytny i prosty pomysł na symulację z ogona normalnego rozkładu.
whuber
Mniej więcej to samo pytanie w Math.SE: math.stackexchange.com/questions/749664/average-iq-of-mensa
JiK

Odpowiedzi:

18

Xμσ2σZ+μZZ

  • Φ
  • ϕ(z)=Φ(z)
  • ϕ(z)=zϕ(z)

Pierwsze dwa pociski to tylko zapis i definicje: trzeci to jedyna specjalna właściwość normalnych dystrybucji, której będziemy potrzebować.

TXZ

t=(Tμ)/σ,

po to aby

Pr(XT)=Pr(Zt)=Φ(t).

Następnie, zaczynając od definicji warunkowego oczekiwania, możemy wykorzystać jego liniowość do uzyskania

E(X|XT)=E(σZ+μ|Zt)=σE(Z|Zt)+μE(1|Zt)=(σtzϕ(z)dz+μtϕ(z)dz)/Pr(Zt)=(σtϕ(z)dz+μtΦ(z)dz)/Φ(t).

Fundamentalne twierdzenie rachunku całkowego stwierdza, że ​​dowolną całkę pochodnej można znaleźć, oceniając funkcję w punktach końcowych: . Dotyczy to obu całek. Ponieważ zarówno i muszą zniknąć w , otrzymujemyabF(z)dz=F(b)F(a)Φϕ

E(X|XT)=μσϕ(t)Φ(t).

Jest to pierwotna średnia minus składnik korekcji proporcjonalny do współczynnika odwrotności młynów .

! [rysunek: wykres odwrotnego stosunku Millsa

Jak można się spodziewać, odwrotny stosunek Millsa dla musi być dodatni i przekraczać (którego wykres pokazano czerwoną kropkowaną linią). Musi zmniejszać się do gdy rośnie, ponieważ wówczas obcięcie przy (lub ) prawie nic nie zmienia. Gdy rośnie bardzo ujemnie, odwrotny stosunek Millsa musi zbliżyć się do ponieważ ogony rozkładu normalnego zmniejszają się tak szybko, że prawie całe prawdopodobieństwo w lewym ogonie jest skoncentrowane w pobliżu jego prawej strony (w punkcie ).tt0tZ=tX=Tttt

Wreszcie, gdy jest na średniej, gdzie odwrotny współczynnik Millsa wynosi . Oznacza to, że oczekiwana wartość , skrócona do jego średniej (która jest ujemna z rozkładu o połowie normalnej wartości ), to razy jej odchylenie standardowe poniżej pierwotnej średniej.T=μt=02/π0.797885X2/π

Whuber
źródło
6

Ogólnie rzecz biorąc, niech ma funkcję dystrybucji .XF(X)

Mamy dla , Możesz uzyskać specjalne przypadki, biorąc na przykład , co daje .x[c1,c2]

P(Xx|c1Xc2)=P(Xxc1Xc2)P(c1Xc2)=P(c1Xx)P(c1Xc2)=F(x)F(c1)F(c2)F(c1)
c1=F(c1)=0

Korzystając z warunkowych plików cdf, możesz uzyskać gęstości warunkowe (np. dla ), które mogą być użyte do oczekiwań warunkowych.f(x|X<0)=2ϕ(x)XN(0,1)

W twoim przykładzie integracja przez części daje jak w odpowiedzi @ Whubera.

E(X|X<0)=20xϕ(x)=2ϕ(0),
Christoph Hanck
źródło
+1 (jakoś mi tego brakowało, kiedy po raz pierwszy się pojawił). Pierwsza część to doskonała relacja o tym, jak uzyskać obcięte funkcje dystrybucji, a druga pokazuje, jak obliczyć ich pliki PDF.
whuber