Czy estymator bezstronny minimalizuje średnie odchylenie bezwzględne?

14

Jest to kontynuacja, ale także inne pytanie w stosunku do mojego poprzedniego .

Czytałem na Wikipedii, że „ Estymator bezstronny minimalizuje ryzyko związane z funkcją utraty absolutnego odchylenia, jak zaobserwował Laplace ”. Jednak moje wyniki symulacji Monte Carlo nie potwierdzają tego argumentu.

próbkę z populacji logarytmicznej, , gdzie i są średnią logarytmiczną i log-sd,μ σ β = exp ( μ ) = 50X1,X2,...,XNLN(μ,σ2)μσβ=exp(μ)=50

Estymator średniej geometrycznej jest estymatorem bezstronnym dla mediany populacji ,exp(μ)

β^GM=exp(μ^)=exp(log(Xja)N.)LN(μ,σ2)/N.) gdzie, i są średnią logarytmiczną, a log-sd, i to MLE dla i .μσμ^σ^μσ

Podczas gdy skorygowany estymator średniej geometrycznej jest estymatorem bezstronnym dla mediany populacji.

β^CG=exp(μ^-σ^2)/2)N.)

Generuję próbki wielkości 5 wielokrotnie z LN . Numer replikacji to 10 000. Średnie bezwzględne odchylenia, które otrzymałem, wynoszą 25,14 dla estymatora średniej geometrycznej i 22,92 dla skorygowanej średniej geometrycznej. Dlaczego?(log(50),log(1+22))

BTW, oszacowana mediana bezwzględnych odchyleń wynosi 18,18 dla średniej geometrycznej i 18,58 dla skorygowanego estymatora średniej geometrycznej.

Użyłem skryptu R:

#```{r stackexchange}
#' Calculate the geomean to estimate the lognormal median.
#'
#' This function Calculate the geomean to estimate the lognormal
#' median.
#'
#' @param x a vector.
require(plyr)
GM <- function(x){
    exp(mean(log(x)))
}
#' Calculate the bias corrected geomean to estimate the lognormal
#' median.
#'
#' This function Calculate the bias corrected geomean using the
#' variance of the log of the samples, i.e., $\hat\sigma^2=1/(n-1)
# \Sigma_i(\Log(X_i)-\hat\mu)^2$
#'
#' @param x a vector.
BCGM <- function(x){
y <- log(x)
exp(mean(y)-var(y)/(2*length(y)))
}
#' Calculate the bias corrected geomean to estimate the lognormal
#' median.
#'
#' This function Calculate the bias corrected geomean using
#' $\hat\sigma^2=1/(n)\Sigma_i(\Log(X_i)-\hat\mu)^2$
#'
#' @param x a vector.
CG <- function(x){
y <- log(x)
exp(mean(y)-var(y)/(2*length(y))*(length(y)-1)/length(y))
}

############################

simln <- function(n,mu,sigma,CI=FALSE)
{
    X <- rlnorm(n,mu,sigma)
    Y <- 1/X
    gm <- GM(X)
    cg <- CG(X)
    ##gmk <- log(2)/GM(log(2)*Y) #the same as GM(X)
    ##cgk <- log(2)/CG(log(2)*Y)
    cgk <- 1/CG(Y)
    sm <- median(X)
    if(CI==TRUE) ci <- calCI(X)
    ##bcgm <- BCGM(X)
    ##return(c(gm,cg,bcgm))
    if(CI==FALSE) return(c(GM=gm,CG=cg,CGK=cgk,SM=sm)) else return(c(GM=gm,CG=cg,CGK=cgk,CI=ci[3],SM=sm))
}
cv <-2
mcN <-10000
res <- sapply(1:mcN,function(i){simln(n=5,mu=log(50),sigma=sqrt(log(1+cv^2)), CI=FALSE)})
sumres.mad <- apply(res,1,function(x) mean(abs(x-50)))
sumres.medad <- apply(res,1,function(x) median(abs(x-50)))
sumres.mse <- apply(res,1,function(x) mean((x-50)^2))
#```

#```{r eval=FALSE}
#> sumres.mad
      GM       CG      CGK       SM 
#25.14202 22.91564 29.65724 31.49275 
#> sumres.mse
      GM       CG      CGK       SM 
#1368.209 1031.478 2051.540 2407.218 
#```
Zhenglei
źródło
1
1.) „10 000” jest za małe na twoje pytanie - spróbuj „250 000” (lub więcej). 2.) Jeśli uruchomisz symulację Monte Carlo i uzyskasz dziwny wynik, spróbuj zmienić ziarno za pomocą set.seed. 3) nie zawsze ufaj Wikipedia - notatka w jaki sposób cytowany tekst (z „Mediana” Artykuł) różni się od tej drugiej Wikipedia artykuł 4.) Twój R kod jest totalny bałagan - Check out Google R Style Przewodnik dla niektórych dobre wytyczne stylu.
Steve S

Odpowiedzi:

4

α+α

E=<|α+α|>=α+(α+α)f(α)dα+α+(αα+)fa(α)reα

my wymagamy

remireα+=-α+fa(α)reα-α+fa(α)reα=0

P.(α>α+)=1/2)α+

Jeśli masz problemy z R, zadaj je w innym pytaniu na temat Przepełnienia stosu

Keith
źródło
Teoretycznie myślę, że to prawda. Jestem jednak zdezorientowany wynikami symulacji R, która nie tworzy kopii zapasowej tego stwierdzenia zgodnie z oczekiwaniami.
Zhenglei
2
Jestem Data Scientist / Physicist, więc nigdy nie widziałem linii R. Jak zasugerowałem w pytaniu, jeśli jest to problem z kodem, powinieneś zadać go w przepełnieniu stosu i zyskasz znacznie więcej uwagi. Jednak powyższa odpowiedź jest poprawna, chyba że chciałbyś wyjaśnić, w jaki sposób uogólnia ją na estymator bezstronny. Więcej informacji znajduje się na stronie 172 książki ET Jaynesa Teoria prawdopodobieństwa ISBN 978-0-521-59271-0.
Keith,
Dziękuję bardzo za odpowiedź. To nie jest problem z kodowaniem. Chcę tylko przeprowadzić symulacje, aby pokazać, że estymator bezstronny zminimalizuje oczekiwane odchylenie bezwzględne. Nie zaakceptowałem odpowiedzi, ponieważ jestem głównie zdezorientowany co do etapu symulacji. Zaimplementowałem go w języku R, ale symulacje można wykonać w Matlabie, Pythonie lub innych językach.
Zhenglei
2
@ Przykro mi z powodu mojej słabej matematyki, ale czy możesz pokazać więcej szczegółów na temat tego, jak uzyskałeś oczekiwania?
AdamO,