Pytanie
Jeśli są IID, to oblicz , gdzie .X1,⋯,Xn∼N(μ,1)
X1,⋯,Xn∼N(μ,1) E(X1∣T)E(X1∣T) T=∑iXiT=∑iXi
Próba : Sprawdź, czy poniższe informacje są prawidłowe.
Powiedzmy, że bierzemy sumę tych warunkowych oczekiwań, tak, że:
∑iE(Xi∣T)=E(∑iXi∣T)=T.
Oznacza to, że każdy E(Xi∣T)=Tn
Zatem E(X1∣T)=Tn
probability
self-study
mathematical-statistics
conditional-probability
conditional-expectation
uczenie się
źródło
źródło
Odpowiedzi:
Pomysł jest słuszny - ale trzeba go wyrazić nieco bardziej rygorystycznie. Dlatego skupię się na notacji i odsłonięciu istoty pomysłu.
Zacznijmy od idei wymienności:
Wyraźnie oznacza to, że można je wymieniać.
W ramach notacji napisz dla komponentu w i pozwólXσi=Xσ(i)Xσi=Xσ(i) ithith XσXσ Tσ=n∑i=1Xσi=n∑i=1Xi=T.Tσ=∑i=1nXσi=∑i=1nXi=T.
Niech będzie dowolnym indeksem i niech będzie dowolną permutacją indeksów, które wysyłają do (Taki istnieje, ponieważ zawsze można po prostu zamienić i ) Wymienność implikujejj σσ 11 j=σ(1).j=σ(1). σσ 11 j.j. XX
E[X1∣T]=E[Xσ1∣Tσ]=E[Xj∣T],E[X1∣T]=E[Xσ1∣Tσ]=E[Xj∣T],
ponieważ (w pierwszej nierówności) po prostu zastąpiliśmy identycznie rozmieszczonym wektoremTo jest sedno sprawy.XX Xσ.Xσ.
w konsekwencji
T=E[T∣T]=E[n∑i=1Xi∣T]=n∑i=1E[Xi∣T]=n∑i=1E[X1∣T]=nE[X1∣T],T=E[T∣T]=E[∑i=1nXi∣T]=∑i=1nE[Xi∣T]=∑i=1nE[X1∣T]=nE[X1∣T],
skąd
E[X1∣T]=1nT.E[X1∣T]=1nT.
źródło
Niech i więc . Uwzględniamy wtedy zdarzenie, że dla jakiegoś , więc to jest jak rysowanie wielowymiarowych Gaussianów obsługiwanych na ale patrząc tylko na te, które kończą w afinii spacja . Następnie chcemy poznać średnią współrzędnych punktów, które lądują w tej afinicznej przestrzeni (nie wspominając, że jest to podzbiór miary zero).X=(X1,…,Xn)TX=(X1,…,Xn)T 1=(1,…,1)T1=(1,…,1)T T=1TXT=1TX 1TX=t1TX=t t∈Rt∈R RnRn {x∈Rn:1Tx=t}{x∈Rn:1Tx=t} x1x1
Znamy więc mamy sferyczny gaussian ze stałym średnim wektorem, a średni wektor jest na tej samej linii, co normalny wektor hiperpłaszczyzny .X∼N(μ1,I)X∼N(μ1,I) μ1μ1 xT1=0xT1=0
To daje nam sytuację jak na poniższym obrazku:
Kluczowa idea: najpierw wyobraź sobie gęstość w podprzestrzeni afinicznej . Gęstość jest symetryczna wokół ponieważ . Gęstość będzie również symetryczna w jak jest symetryczny w tym samym wierszu, a punkt, wokół której jest symetryczny jest przecięciem linii i . Dzieje się tak dla .Ht:={x:xT1=t}Ht:={x:xT1=t} XX x1=x2x1=x2 E(X)∈span 1E(X)∈span 1 HtHt HtHt x1+x2=tx1+x2=t x1=x2x1=x2 x=(t/2,t/2)x=(t/2,t/2)
Aby wyobrazić sobie , możemy sobie wyobrazić próbkowanie w kółko, a następnie, gdy otrzymamy punkt w , bierzemy tylko współrzędną i zapisujemy to. Z symetrii gęstości na również rozkład współrzędnych będzie symetryczny i będzie miał ten sam punkt środkowy . Średnia rozkładu symetrycznego jest centralnym punktem symetrii, co oznacza, że , i że ponieważ i można wykasować bez wpływu byle co.E(X1|T)E(X1|T) HtHt x1x1 HtHt x1x1 t/2t/2 E(X1|T)=T/2E(X1|T)=T/2 E(X1|T)=E(X2|T)E(X1|T)=E(X2|T) X1X1 X2X2
W wyższych wymiarach staje się to trudne (lub niemożliwe) do dokładnej wizualizacji, ale ten sam pomysł ma zastosowanie: mamy sferyczny gaussowski ze średnią w zakresie , i patrzymy na afiniczną podprzestrzeń, która jest do niej prostopadła . Punktem równowagi rozkładu w podprzestrzeni będzie nadal przecięcie i o wartości , a gęstość jest nadal symetryczna, więc ten punkt równowagi jest znowu średnią.11 span 1span 1 {x:xT1=t}{x:xT1=t} x=(t/n,…,t/n)x=(t/n,…,t/n)
Ponownie, to nie jest dowód, ale myślę, że daje to dobre wyobrażenie o tym, dlaczego można oczekiwać tego zachowania.
Poza tym, jak zauważyli niektórzy tacy jak @StubbornAtom, tak naprawdę nie wymaga to, aby był gaussowski. W 2D zaznacz, że jeśli jest wymienny, to (bardziej ogólnie, ), więc musi być symetryczne wzdłuż linii . Mamy też więc wszystko, co powiedziałem o „kluczowym pomyśle” na pierwszym zdjęciu, nadal jest aktualne. Oto przykład, w którym pochodzą z modelu mieszanki Gaussa. Wszystkie linie mają takie samo znaczenie jak poprzednio.XX XX f(x1,x2)=f(x2,x1)f(x1,x2)=f(x2,x1) f(x)=f(xσ)f(x)=f(xσ) ff x1=x2x1=x2 E(X)∈span 1E(X)∈span 1 XiXi
źródło
Myślę, że twoja odpowiedź jest prawidłowa, chociaż nie jestem do końca pewny co do linii zabójców w twoim dowodzie, że jest to prawdą „ponieważ są tam”. Bardziej niewygodny sposób na to samo rozwiązanie jest następujący:
Zastanów się, co tak naprawdę oznacza . Wiesz, że masz próbkę z odczytami N i że ich średnia to T. To tak naprawdę oznacza, że teraz podstawowy rozkład, z którego pobrano próbki, nie ma już znaczenia (zauważysz, że w żadnym momencie nie użyłeś faktu, że był próbka z Gaussa w twoim dowodzie).E(xi|T)E(xi|T)
E(xi|T)E(xi|T) jest odpowiedzią na pytanie, jeśli próbkowałeś z próbki, wielokrotnie zastępując, jaka byłaby średnia uzyskana. Jest to suma wszystkich możliwych wartości, pomnożona przez ich prawdopodobieństwo lub co jest równe T.∑Ni=11Nxi∑Ni=11Nxi
źródło