Czy próbka oznacza w pewnym sensie „najlepsze” oszacowanie średniej dystrybucji?

10

Według (słabego / silnego) prawa dużych liczb, biorąc pod uwagę niektóre punkty próbki iid rozkładu, ich średnia próbka f ( { x i , i = 1 , , N } ) : = 1{xiRn,i=1,,N}zbieżne ze średnią rozkładu zarówno w prawdopodobieństwie, jak i w miarę, jak wielkość próbkiN idzie do nieskończoności.f({xi,i=1,,N}):=1Ni=1NxiN

Kiedy wielkość próbki jest ustalona, ​​zastanawiam się, czy estymator LLN f jest w pewnym sensie najlepszym estymatorem? Na przykład,Nf

  1. jego oczekiwanie jest średnią rozkładu, więc jest obiektywnym estymatorem. Jego wariancja wynosi gdzieσ2jest wariancją rozkładu. Ale czy to UMVU?σ2Nσ2
  2. czy jest jakaś funkcja taka, że f ( { x i , i = 1 , , N } ) rozwiązuje problem minimalizacji: f ( { x i , i = 1 , , N } ) = argmin u R nl0:Rn×Rn[0,)f({xi,i=1,,N})

    f({xi,i=1,,N})=argminuRni=1Nl0(xi,u)?

    Innymi słowy, jest najlepszą opcją dla funkcji kontrastu l 0 w ramach minimalnego kontrastu (por. Rozdział 2.1 „Podstawowa heurystyka estymacji” w „ Statystyka matematyczna: podstawowe idee i wybrane tematy, tom 1 ” Bickle i Doksum).fl0

    Na przykład, jeśli rozkład jest znany / ograniczony z rodziny rozkładów Gaussa, wówczas średnia próbki będzie estymatorem MLE średniej rozkładu, a MLE należy do ramy minimalnego kontrastu, a jego funkcja kontrastu jest minus log funkcja wiarygodności.l0

  3. czy jest jakaś funkcja taka, że f rozwiązuje problem minimalizacji: f = argmin fl:Rn×F[0,)f dla każdej dystrybucji P od x i w pewnym rodzinnym F rozkładów?

    f=argminfEiid {xi,i=1,,N} each with distribution Pl(f({xi,i=1,,N}),P)?
    PxiF

    Innymi słowy, jest najlepszym rozwiązaniem dla niektórych utraconych funkcji 1 i niektórych rodzin F rozkładów w ramach teoretycznych decyzji (por. Sekcja 1.3 „Teoretyczne ramy decyzyjne” w „ Statystyka matematyczna: podstawowe idee i wybrane tematy, tom 1 ” autorstwa Bickle i Doksum).flF

Zauważ, że powyższe są trzema różnymi interpretacjami dla „najlepszej” oceny, którą znałem do tej pory. Jeśli znasz inne możliwe interpretacje, które mogą mieć zastosowanie do estymatora LLN, nie wahaj się o tym również wspomnieć.

Tim
źródło
Innym sposobem, aby scharakteryzować estymator: Proszę przeczytać o Spójne prognozy tutaj . Średnia próbki jest spójna ze względu na LLN.
Rohit Banga
1
Średnia próbki ma wiele miłych i interesujących właściwości, ale czasami nie są najlepsze, jakie można mieć w konkretnej sytuacji. Jednym z przykładów są przypadki, w których obsługa rozkładu zależy od wartości parametru. Rozważ , a następnie 1X1,X2,,XnU(0,θ)jest obiektywnym estymatorem średniej rozkładuθ,ale nie jest to UMVUE, na przykład obiektywne szacunki oparte na statystyce największego rzędun+11ni=1nXiθbędzie mieć mniejszą wariancję niż średnia z próby. n+1nX(n)
VitalStatistix
Dzięki! Ale jak oblicza się jego wariancję?
Tim
Y=X(n)
f(y)=nyn1θn;y(0,θ)
nn+1YVar(nn+1Y)=1n(n+2)θ21n21n
[0,θ]θ/2θ

Odpowiedzi:

4

l0(xu)2(xu)(xu)

Estymator minimalnego kontrastu jest, w pewnych warunkach technicznych, zarówno spójny, jak i asymptotycznie normalny. Dla średniej próbki wynika to już z LLN i centralnego twierdzenia granicznego. Nie wiem, czy estymatory minimalnego kontrastu są w jakikolwiek sposób „optymalne”. Zaletą estymatorów minimalnego kontrastu jest to, że wiele solidnych estymatorów (np. Mediana, estymatory Hubera, kwantyle próbne) należą do tej rodziny, i możemy stwierdzić, że są one spójne i asymptotycznie normalne, po prostu stosując ogólne twierdzenie o estymatorach minimalnego kontrastu, więc dopóki sprawdzimy niektóre warunki techniczne (choć często jest to o wiele trudniejsze niż się wydaje).

Jednym pojęciem optymalności, o którym nie wspominasz w pytaniu, jest wydajność, która, z grubsza mówiąc, dotyczy tego, jak duża próbka jest potrzebna do oszacowania określonej jakości. Zobacz http://en.wikipedia.org/wiki/Efficiency_(statistics)#Asymptotic_fficiency w celu porównania wydajności średniej i mediany (średnia jest bardziej wydajna, ale mediana jest bardziej odporna na wartości odstające).

xi

fPfmaxPFPFPP

DavidR
źródło
Dzięki! Czy istnieją jakieś dobre odniesienia do właściwości estymatora minimalnego kontrastu, takie jak spójny i asymptotycznie normalny, a także przykłady, takie jak mediana, estymatory Hubera, kwantyle próbek?
Tim
Sekcja 5.2.2 cytowanej przez ciebie książki Bickel & Doksum zawiera twierdzenie o zgodności estymatorów minimalnego kontrastu. Rozdział 5.4.2 omawia asymptotyczną normalność. Innym źródłem, które polecam i które omawia inne estymatory, o których wspominam, jest książka Asymptotic Statistics van der Vaarta . Rozdział 5 dotyczy M-estymatorów, jak nazywa się estymatory minimalnego kontrastu.
DavidR
Rnl2
Mam na myśli standardową normę euklidesową - zmieniłem ją na notację wektorową w celu wyjaśnienia.
DavidR
l