Jaka jest wariancja tego estymatora

10

Chcę oszacować średnią funkcji f, tj. gdzie i są niezależnymi zmiennymi losowymi. Mam próbki f, ale nie iid: Są próbki IID dla a dla każdego są próbki z :X Y Y 1 , Y 2 , Y n Y i n i X X i , 1 , X i , 2 , , X i , n i

EX,Y[f(X,Y)]
XYY1,Y2,YnYiniXXi,1,Xi,2,,Xi,ni

Więc w sumie mam próbkif(X1,1,Y1)f(X1,n1,Y1)f(Xi,j,Yi)f(Xn,nn,Yn)

Aby oszacować średnią, obliczam Oczywiście więc jest obiektywnym estymatorem. Zastanawiam się teraz, czym jest , tj. Wariancja estymatora. EX,Y[μ]=EX,Y[f(X,Y)]μVar(μ)

μ=i=1n1/nj=1nif(Xi,j,Yi)ni
EX,Y[μ]=EX,Y[f(X,Y)]
μVar(μ)

Edycja 2: Czy to poprawna wariancja? It wydaje się działać w granicach, tj. jeśli n = 1 i wszystkie wariancja staje się wariancją średnich. A jeśli wzór staje się standardowym wzorem dla wariancji estymatorów. Czy to jest poprawne? Jak mogę udowodnić, że tak jest?

Var(μ)=VarY(μi)n+i=1nVarX(f(X,Yi)))nin2
ni=ni=1

Edytuj (zignoruj ​​to):

Myślę więc, że zrobiłem pewien postęp: najpierw zdefiniujmy który jest obiektywnym estymatorem .μi=j=1nif(Xi,j,Yi)niEX[f(X,Yi)]

Stosując standardową formułę wariancji możemy napisać:

Var(μ)=1/n2l=1nk=1nCov(μl,μk)
Można to uprościć do i ponieważ s są rysowane niezależnie, możemy dodatkowo uprościć to do A dla kowariancji:
1/n2(i=1nVar(μl)+1/n2l=1nk=l+1n2Cov(μl,μk))
Xij
1/n2(i=1n1/niVar(f(Xi,j,Yi))+1/n2l=1nk=l+1n2Cov(μl,μk))
Cov(μl,μk)=Cov(j=1nlf(Xj,l,Yl)nl,j=1nkf(Xj,k,Yk)nk)=1(nknl)Cov(j=1nlf(Xj,l,Yl),j=1nkf(Xj,k,Yk))=1(nknl)j=1nlj=1nkCov(f(X,Yl),f(X,Yk))=nknl(nknl)Cov(f(Xi,l,Yl),f(Xi,k,Yk))=Cov(f(X,Yl),f(X,Yk))
Podłączając to z powrotem otrzymujemy Mam teraz wiele pytań:
1/n2(i=1n1/niVar(f(X,Yi))+1/n2l=1nk=l+1n2Cov(f(X,Yl),f(X,Yk)))
  1. Czy powyższe obliczenia są prawidłowe?

  2. Jak mogę oszacować na podstawie podanych próbek?Cov(f(X,Yl),f(X,Yk)))

  3. Czy wariancja zbiegnie się do 0, jeśli pozwolę n przejść do nieskończoności?

Benedikt Bünz
źródło

Odpowiedzi:

2

P1: Nie, to nie do końca prawda. Pomijasz indeksy dolne w wierszu 3 końcowego wyprowadzenia kowariancji. To przesłania fakt, że dwa RV oznaczone jako „X” są w rzeczywistości niezależne od siebie: jeden miał indeks dolny a drugi . W całym bloku równości jedynymi niezerowymi warunkami powinno być kiedy , ponieważ funkcje niezależnych danych wejściowych są niezależne. (Zakładam, że nie stwierdzenie jest niezależny od nawet jeśli nie wynika to ściśle z pary twierdzeń o niezależności między wszystkimi i )kk=X12,Y1X22,Y2XY

Q2: Z góry ten termin jest niezerowy tylko wtedy, gdy , w takim przypadku sprowadza się do . Wynik po sumie to .k=Cov(f(Xjk,Yk),f(Xjk,Yk))=Var(f(Xjk,Yk))Cov(μk,μk)=1nkVar(f(Xjk,Yk))

P3: Tak: po tych modyfikacjach będziesz mieć tylko liniową liczbę terminów w ostatniej sumie, więc kwadratowy termin mianownika wygra.

eric_kernfeld
źródło
Odpowiedź na „Czy wariancja jest zbieżna z 0, jeśli pozwolę n przejść w nieskończoność?” jest tak".
eric_kernfeld