Załóżmy, że w1,w2,…,wn i x1,x2,...,xn są każdy narysowany IID go w dystrybucji z niezależnie od . W są absolutnie pozytywne. Obserwujesz wszystkie , ale nie ; raczej obserwujesz . Jestem zainteresowany oszacowaniem nazwawixiwiwixi∑ixiwiE[x] podstawie tych informacji. Oczywiście estymator
x¯=∑iwixi∑iwi
jest bezstronny i można go obliczyć, biorąc pod uwagę dostępne informacje.
Jak mogę obliczyć standardowy błąd tego estymatora? W przypadku, w którym xi przyjmuje tylko wartości 0 i 1, naiwnie próbowałem
se≈x¯(1−x¯)∑iw2i−−−−−−−−−−−−√∑iwi,
w zasadzie nie zważając na zmienność
wi, ale okazało się, że to źle wykonywane na próbce o rozmiarach mniejszych niż około 250. (i to prawdopodobnie zależy od wariancji
wi). Wydaje się, że może nie robić mieć wystarczającą ilość informacji, aby obliczyć „lepszy” błąd standardowy.
w=rep(1, length(x))
, toweighted.var.se(rnorm(50), rep(1, 50))
jest o0.014
. Myślę, że w formule brakuje asum(w^2)
w liczniku, ponieważ kiedy występujeP=1
wariancja1/(n*(n-1)) * sum((x-xbar)^2)
. Nie mogę sprawdzić cytowanego artykułu, ponieważ znajduje się on za zaporą, ale myślę, że to poprawka. Co dziwne, rozwiązanie Wikipedii (inne) ulega degeneracji, gdy wszystkie wagi są równe: en.wikipedia.org/wiki/… .Wariancja twojego oszacowania przy wynosi ∑ w 2 i V a r ( X )wja
Ponieważ twoje oszacowanie jest obiektywne dla dowolnegowi, wariancja jego średniej warunkowej wynosi zero. Zatem wariancja twojego oszacowania wynosi
Var(X)E(∑ w 2 i
źródło