Czy średni błąd kwadratu służy do oceny względnej przewagi jednego estymatora nad drugim?

13

Załóżmy, że mamy dwa estymatory i dla niektórych parametrów . Aby ustalić, który estymator jest „lepszy”, czy patrzymy na MSE (średni błąd kwadratu)? Innymi słowy, patrzymy na gdzie jest błędem estymatora, a jest wariantem estymatora? Którykolwiek większy MSE jest gorszym estymatorem?α 2 x M S E = β 2 + σ 2 β σ 2α1α2x

MSE=β2+σ2
βσ2
Damien
źródło

Odpowiedzi:

10

Jeśli dwie konkurujące estymatory θ 1 i θ 2 , czy M S E ( θ 1 ) < M S E ( θ 2 ) mówi, że θ 1 jest lepszy estymator zależy wyłącznie od twojej definicji "Najlepsza". Na przykład, jeśli porównujesz bezstronne estymatorów i „lepiej” znaczy ma mniejszą wariancję następnie, tak, oznaczałoby to, że θ 1 jest lepsza. M S Eθ^1θ^2

MSE(θ^1)<MSE(θ^2)
θ^1θ^1MSEjest popularnym kryterium ze względu na związek z najmniejszymi kwadratami i prawdopodobieństwem logarytmicznym Gaussa, ale podobnie jak wiele kryteriów statystycznych, należy ostrzec przed użyciem ślepo jako miary jakości estymatora bez zwracania uwagi na zastosowanie.MSE

Istnieją pewne sytuacje, w których wybór estymatora w celu zminimalizowania może nie być szczególnie rozsądnym rozwiązaniem. Przychodzą mi na myśl dwa scenariusze:MSE

  • Jeśli w zestawie danych występują bardzo duże wartości odstające, mogą one drastycznie wpłynąć na MSE, a zatem takie wartości odstające mogą wpływać na estymator, który minimalizuje MSE. W takich sytuacjach fakt, że estymator minimalizuje MSE, nie mówi zbyt wiele, ponieważ jeśli usuniesz wartości odstające, możesz uzyskać zupełnie inną ocenę. W tym sensie MSE nie jest „odporny” na wartości odstające. W kontekście regresji fakt ten motywował Huber M-Estimator (który omawiam w tej odpowiedzi), który minimalizuje inną funkcję kryterium (czyli połączenie błędu kwadratu i błędu absolutnego), gdy występują błędy o długich ogonach .

  • Jeśli szacujesz ograniczony parametr, porównywanie może nie być właściwe, ponieważ w takim przypadku inaczej karze się i zaniżanie. Załóżmy na przykład, że szacujesz wariancję, σ 2 . Następnie, jeśli świadomie nie docenisz ilości, twoje M S E może wynosić co najwyżej σ 4 , podczas gdy przeszacowanie może wytworzyć M S E znacznie przekraczające σ 4 , być może nawet o nieograniczoną kwotę.MSEσ2)M.S.miσ4M.S.miσ4

Aby wyjaśnić te wady, podam konkretny przykład, kiedy z powodu tych problemów może nie być odpowiednią miarą jakości estymatora.M.S.mi

X1,...,Xntν>2)ν/(ν-2))

θ^1:thmi unbjazasmire szamplmi vzarjazandomi
θ^2)=0, rmisolzarrelmiss ofa thmi rezatza
M.S.mi(θ^2))=ν2)(ν-2))2)
M.S.mi(θ^1)={gdyby ν4ν2)(ν-2))2)(2)n-1+6n(ν-4))gdyby ν>4.
tM.S.miν<4(2)n-1+6n(ν-4))>1tθ^2)M.S.miθ^1

M.S.miM.S.miθ^

S.(θ^)=θ^ν/(ν-2))-1-log(θ^ν/(ν-2)))

S.(θ^1)=

Makro
źródło
(+1) Miła dyskusja. Aby być uczciwym, należy prawdopodobnie zauważyć, że podobne argumenty można przedstawiać za i przeciw innym kryteriom (innym funkcjom strat).
MånsT
2
Zwykle ocenia się estymatory, przyglądając się ich funkcjom ryzyka, które wykreślają oczekiwaną stratę w stosunku do parametrów. Tutaj, ustalając parametry, mogłeś stworzyć mylącą analizę. W końcu zawsze jest tak, że głupi (stały, nieświadomy danych) estymator może generować bardzo niską oczekiwaną stratę: po prostu ustaw go na odpowiedni parametr! To mnie zastanawia, co naprawdę pokazała tutaj symulacja.
whuber
@ Whuber, zmodyfikowałem tę odpowiedź, aby podać przykład analitycznie, co może być bardziej jasne. Zaproponowałem także alternatywną funkcję straty, która może być bardziej odpowiednia.
Makro
ν
2

L.(αja)=(αja-α)2)

JMS
źródło
2

fa(x)=x2)

fa(x)=|x|

MSE jest prawdopodobnie dobrym wyborem, jeśli warunki błędu są zwykle dystrybuowane. Jeśli mają grubsze ogony, preferowany jest bardziej solidny wybór, taki jak wartość bezwzględna.

aprokopiw
źródło
0

W Wniosku statystycznym Case & Berger, wydanie drugie, strona 332 stwierdza, że ​​MSE karze równo za przeszacowanie i niedoszacowanie, co jest dobre w przypadku lokalizacji. Jednak w przypadku skali 0 jest naturalną dolną granicą, więc problem estymacji nie jest symetryczny. Zastosowanie MSE w tym przypadku zwykle wybacza niedoszacowanie.

Możesz sprawdzić, który estymator spełnia właściwości UMVUE, co oznacza użycie dolnej granicy Cramer-Rao. Str. 341.

Tu.2
źródło