Wariancja średniej próbki próbki ładowania początkowego

9

Niech będą odrębnymi obserwacjami (bez powiązań). Niech oznacza próbkę bootstrap (próbka z empirycznego CDF) i niech . Znajdź i .X1,...,XnX1,...,XnX¯n=1ni=1nXiE(X¯n)Var(X¯n)

Do tej pory mam to, że to każdy z prawdopodobieństwem więc i co daje XiX1,...,Xn1n

E(Xi)=1nE(X1)+...+1nE(Xn)=nμn=μ
E(Xi2)=1nE(X12)+...+1nE(Xn2)=n(μ2+σ2)n=μ2+σ2,
Var(Xi)=E(Xi2)(E(Xi))2=μ2+σ2μ2=σ2.

Następnie and od ' są niezależne. To daje

E(X¯n)=E(1ni=1nXi)=1ni=1nE(Xi)=nμn=μ
Var(X¯n)=Var(1ni=1nXi)=1n2i=1nVar(Xi)
XiVar(X¯n)=nσ2n2=σ2n

Jednak nie otrzymuję tej samej odpowiedzi, gdy na i używam formuły dla wariacyjnej wariancji: X1,,Xn

Var(X¯n)=E(Var(X¯n|X1,...,Xn))+Var(E(X¯n|X1,,Xn)).

E(X¯n|X1,,Xn)=X¯n i Var(X¯n|X1,,Xn)=1n2(Xi2nX¯n2) więc podłączenie ich do powyższej formuły daje (po pewnej algebrze) Var(X¯n)=(2n1)σ2n2 .

Czy robię tu coś złego? Mam wrażenie, że nie używam poprawnie formuły wariancji warunkowej, ale nie jestem pewien. Każda pomoc będzie mile widziana.

zamieszanie
źródło
Być może twoje V (E (X | X1..Xn)) nie jest poprawnie obliczone. Odpowiedź powinna być taka sama.
Prawdopodobnie masz rację - ale ta odpowiedź nie wydaje się zbyt pouczająca. Być może mógłbyś wskazać, która część jest nieprawidłowa?
whuber

Odpowiedzi:

5

Prawidłowa odpowiedź to . Rozwiązaniem jest tutaj # 4n1n2S2

Greg
źródło
4

To może być późna odpowiedź, ale to, co jest błędne w obliczeniach, jest następujące: założyłeś, że bezwarunkowo twoja próbka bootstrap jest iid. To nieprawda: zależnie od twojej próbki, próbka bootstrap jest rzeczywiście iid, ale bezwarunkowo tracisz niezależność (ale nadal masz identycznie rozmieszczone losowe zmienne). Jest to zasadniczo ćwiczenie 13 w Larry Wasserman Wszystkie statystyki nieparametryczne .

M. Turgeon
źródło