Jak wytłumaczyć laikowi, czym jest bezstronny rzeczoznawca?

10

Załóżmy, że jest obiektywnym estymatorem . Następnie oczywiście . θE[ θ |θ]=θθ^θE[θ^θ]=θ

Jak wyjaśnić to laikowi? W przeszłości mówiłem, że jeśli uśredniacie wiązkę wartości , ponieważ wraz z powiększaniem się próbki, otrzymacie lepsze przybliżenie . θθ^θ

Dla mnie jest to problematyczne. Myślę, że tak naprawdę opisuję tutaj to zjawisko bycia asymptotycznie bezstronnym, a nie wyłącznie byciem bezstronnym, tj. gdzie \ hat {\ theta} prawdopodobnie zależy od n .

limnE[θ^θ]=θ,
θ^n

Jak więc wyjaśnić laikowi, czym jest bezstronny rzeczoznawca?

Klarnecista
źródło
2
Jest to sposób na dokonanie szacunku, który jest właściwie odpowiedni: zwykle nie jest dokładnie poprawny, ale ogólnie rzecz biorąc nie powoduje przeszacowania częściej niż niedoceniania. Zdaję sobie sprawę, że to sprawia, że ​​brzmi bardziej jak θ jest medianą θ^ niż środkiem, ale myślę, że oddaje to istotną kwestię.
jwimberley
3
Podoba mi się żart „trzech polujących
statystów
2
Twoje wyjaśnienie to Prawo Dużych Liczb, nie ma to nic wspólnego z bezstronnością.
Xi'an
@ Xi'an: Gdyby estymator był stronniczy, limit nie byłby . θ
user2357112 obsługuje Monikę
@ user2357112: w moim rozumieniu (i innych ', jak pokazują dotychczasowe odpowiedzi), gdy wielkość próbki staje się większa, oznacza to, że gdy rośnie do nieskończoności, tj. estymator oparty na obserwacjach. Teraz widzę zdanie można interpretować inaczej. θ^nnn
Xi'an

Odpowiedzi:

14

Technicznie to, co opisujesz, gdy mówisz, że twój estymator zbliża się do prawdziwej wartości wraz ze wzrostem wielkości próby, to (jak wspominali inni) spójność lub zbieżność estymatorów statystycznych. Ta zbieżność może być albo zbieżnością prawdopodobieństwa, co oznacza, że dla każdego , lub prawie pewna zbieżność, która mówi, że . Wskazówki jak limit jest faktycznie wewnątrzlimnP(|θ^nθ|>ϵ)=0ϵ>0P(limn|θ^nθ|>ϵ)=0prawdopodobieństwo w drugim przypadku. Okazuje się, że ta ostatnia forma zbieżności jest silniejsza od drugiej, ale oba oznaczają w zasadzie to samo, to znaczy, że szacunki zbliżają się coraz bardziej do rzeczy, które oceniamy, gdy gromadzimy więcej próbek.

Subtelna kwestia polega na tym, że nawet jeśli albo jest prawdopodobne, albo prawie na pewno, ogólnie nie jest prawdą, że , więc spójność nie oznacza asymptotycznej bezstronności, jak sugerujesz. Musisz być ostrożny podczas przechodzenia między sekwencjami zmiennych losowych (które są funkcjami) do sekwencji oczekiwań (które są całkami).θ^nθlimnE(θ^n)=θ

Pomijając wszystkie kwestie techniczne, obiektywne oznacza tylko, że . Więc kiedy wyjaśnisz to komuś, po prostu powiedz, że jeśli eksperyment byłby powtarzany wiele razy w identycznych warunkach, średnia wartość oszacowania byłaby zbliżona do prawdziwej wartości.E(θ^n)=θ

dsaxton
źródło
5
Twoja wizja świeckiego jest godna podziwu. Wie, co to jest „zbieżność prawdopodobieństwa”, „jak zbieżność”, ogranicza ... To człowiek z przyszłości.
Aksakal
2
Nie sądzę, aby laik wiedział o tych rzeczach. Próbowałem naprawić pewne nieporozumienia w oryginalnym poście. Moja sugestia, jak wyjaśnić sprawę laikowi, znajduje się w ostatnim akapicie.
dsaxton
ten ostatni akapit splata jednak koncepcję uprzedzeń z konsekwencją estymatora, co prawdopodobnie było jednym z nieporozumień OP na początku.
Aksakal
3
Jak to? Powtórzenie eksperymentu w identycznych warunkach oznaczałoby, że wielkość próbki jest stała, więc oczywiście nie mówimy o spójności.
dsaxton
1
Ok, masz rację, ale oznacza to, że sprowadzasz częste spojrzenie na prawdopodobieństwo
Aksakal
9

Nie jestem pewien, czy mylisz spójność i bezstronność.

Spójność: im większy rozmiar próby, tym mniejsza wariancja estymatora.

  • Zależy od wielkości próbki

Bezstronność: oczekiwana wartość estymatora jest równa prawdziwej wartości parametrów

  • Nie zależy od wielkości próbki

Więc twoje zdanie

jeśli uśredniamy wiązkę wartości , ponieważ wielkość próbki staje się większa, otrzymujemy lepsze przybliżenie .θ^θ

Nie jest poprawne. Nawet jeśli wielkość próby stanie się nieskończona, bezstronny estymator pozostanie bezstronnym estymatorem, np. Jeśli oszacujesz średnią jako „średnią +1”, możesz dodać miliard obserwacji do próbki, a twój estymator nadal nie da ci prawdziwej wartości.

Tutaj możesz znaleźć głębszą dyskusję na temat różnicy między konsekwencją a bezstronnością.

Jaka jest różnica między spójnym estymatorem a obiektywnym estymatorem?

Ferdi
źródło
2
Właściwie nie wiem nic na temat spójności, ale mimo wszystko dziękuję.
Klarnecista
1
@Clarinetist Spójność jest być może najważniejszą właściwością estymatora, że ​​przy wystarczającej ilości danych można dowolnie zbliżyć się do właściwej odpowiedzi.
Matthew Gunn
7

@Ferdi już udzielił jasnej odpowiedzi na twoje pytanie, ale uczyńmy to nieco bardziej formalnym.

Niech być próbka niezależnych i identycznie rozproszonych zmiennych losowych z podziału . Jesteś zainteresowany oszacowaniem nieznanej, ale stałej ilości , używając estymatora będącego funkcją . Ponieważ jest funkcją zmiennych losowych, oszacujX1,,XnFθg X 1 , , X n g gX1,,Xng

θ^n=g(X1,,Xn)

jest również zmienną losową. Definiujemy uprzedzenie jako

bias(θ^n)=Eθ(θ^n)θ

estymator jest bezstronny, gdy .Eθ(θ^n)=θ

Mówiąc prostym językiem: mamy do czynienia ze zmiennymi losowymi , więc jeśli nie zostaną zdegenerowane , to jeśli weźmiemy różne próbki, możemy spodziewać się zaobserwowania różnych danych i tak różnych szacunków. Niemniej jednak możemy oczekiwać, że w różnych próbach „średnio” oszacowany byłby „właściwy”, gdyby estymator był obiektywny. Nie zawsze byłoby to właściwe, ale „średnio” byłoby właściwe. Po prostu nie zawsze może być „właściwe” z powodu losowości związanej z danymi.θ^n

Jak już zauważyli inni, fakt, że oszacowanie zbliża się do oszacowanej ilości wraz ze wzrostem próby, tzn. Że prawdopodobieństwo jest zbieżne

θ^nPθ

ma związek z konsekwencją estymatorów , a nie bezstronności. Sama bezstronność nie mówi nam nic o wielkości próby i jej związku z uzyskanymi szacunkami. Ponadto obiektywne estymatory nie zawsze są dostępne i nie zawsze są preferowane w stosunku do stronniczych. Na przykład, po rozważeniu kompromisu wariancji odchylenia, możesz rozważyć użycie estymatora z większym odchyleniem, ale mniejszej wariancji - więc „średnio” byłby większy od wartości rzeczywistej, ale częściej (mniejsza wariancja) oszacowania być bliżej prawdziwej wartości, a następnie w przypadku obiektywnego estymatora.

Tim
źródło
(+1): bardzo dobry punkt, ponieważ rzadko są dostępne obiektywne oszacowania. I wspominając o sprzeciwie stronniczości / wariancji.
Xi'an
2

Najpierw należy odróżnić błąd polegający na nieporozumieniu od błędu statystycznego, szczególnie w przypadku osób świeckich.

Wybór powiedzenia przy użyciu mediany, średniej lub trybu jako estymatora średniej populacji często zawiera uprzedzenia dotyczące poglądów politycznych, religijnych lub teorii nauki. Obliczenia, która estymator jest najlepszą formą średniej, są innego rodzaju niż arytmetyka, która wpływa na błąd statystyczny.

Po minięciu uprzedzeń związanych z wyborem metody możesz zająć się potencjalnymi błędami w metodzie szacowania. Najpierw musisz wybrać metodę, która może mieć stronniczość, oraz mechanizm, który łatwo prowadzi do tej tendencyjności.

Łatwiej jest zastosować punkt widzenia podboju dzielenia, w którym staje się to oczywiste, gdy wielkość próbki zmniejsza się, a oszacowanie staje się wyraźnie stronnicze. Na przykład współczynnik n-1 (vs 'n') w estymatorach rozrzutu próbek staje się oczywisty, gdy n spada z 3 do 2 na 1!

Wszystko zależy od tego, jak „leżąca” jest ta osoba.

Philip Oakley
źródło
Obawiam się, że mówisz o innych uprzedzeniach, niż ta w pytaniu. Czy możesz spróbować sprecyzować, co to jest stronniczość? Piszesz o „potencjalnych błędach w metodzie szacowania”, a to nie wydaje się odpowiadać definicji uprzedzeń (podanej w pytaniu i odpowiedziach powyżej). Ostatecznie to sprawia, że ​​twoja odpowiedź jest myląca ...
Tim
@ Tim, pierwszym krokiem było upewnienie się, że uprzedzenia ludzi zostały wyeliminowane. Drugi krok polegał (i częściowo podąża za zagadnieniami z kroku 1), aby upewnić się, że nauczanie osoby świeckiej nie było już tą metodą X (bezstronną), którą należy wybrać. np. odchylenie standardowe wynosi 1 / n * suma ((x-średnia) ^ 2), ale to (ostrożnie) nie rozróżnia populacji i próby. Większość „świeckich” uczy się bezmyślnej wersji 1 / (N-1) dla próbki. Jeśli masz tylko jedną metodę, ty (osoba świecka) nie masz wyboru, więc stronniczość estymatora nie może stanowić problemu ... To krok Krugera-Dunninga.
Philip Oakley,