Co oznacza „bezstronność”?

21
  • Co to znaczy powiedzieć, że „wariancja jest tendencyjnym estymatorem”.
  • Co to znaczy przekonwertować tendencyjne oszacowanie na obiektywne oszacowanie za pomocą prostej formuły. Co dokładnie robi ta konwersja?
  • Jakie jest praktyczne zastosowanie tej konwersji? Czy przeliczasz te wyniki, używając pewnego rodzaju statystyk?
powyżej
źródło

Odpowiedzi:

22

Można znaleźć wszystko tutaj . Oto krótka odpowiedź.

Niech i σ 2 będą średnią i wariancją zainteresowania; chcesz oszacować σ 2 na podstawie próbki wielkości n .μσ2)σ2)n

Powiedzmy, że używasz następującego estymatora:

S.2)=1nja=1n(Xja-X¯)2) ,

gdzie jest estymatoremμX¯=1ni=1nXiμ .

Nietrudno (patrz przypis) zobaczyć, że E[S2]=n1nσ2 .

Ponieważ , estymator S 2E[S2]σ2S2 jest uważany za stronniczy.

Zauważ jednak, że . Dlatego ˜ S 2=nE[nn1S2]=σ2jest obiektywnym estymatoremσ2.S~2=nn1S2σ2

Notatka

Zacznij od napisania a następnie rozwiń produkt ...(XiX¯)2=((Xiμ)+(μX¯))2

Edytuj, aby uwzględnić swoje komentarze

Oczekiwana wartość nie daje σ 2 (a zatem S 2 jest tendencyjna), ale okazuje się, że można przekształcić S 2 w ˜ S 2, tak że oczekiwanie daje σ 2S2σ2S2S2S~2σ2 .

W praktyce często preferuje się pracę z zamiast S 2 . Ale jeśli n jest wystarczająco duże, nie jest to duży problem, ponieważ nS~2S2n.nn-11

Uwaga Zauważ, że bezstronność jest własnością estymatora, a nie oczekiwań, jak napisałeś.

ocram
źródło
1
Mam na myśli bardziej teoretycznie. Mogę znaleźć formułę w dowolnej książce, ale bardziej interesuje mnie wyjaśnienie słowne. Oczekiwanie sigmy jest obiektywne i czy możemy przekształcić oszacowanie w oczekiwanie?
powyżej
pytam również o praktyczne aspekty tego, czy korzystasz z tej konwersji podczas wykonywania analiz?
powyżej
@ocram Co to jest ? Czy to wielkość próbki? Lub liczba pobranych próbek? Lub obydwa? n
Quirik,
@quirik: Założeniem jest, że pobierana jest pojedyncza próbka i że ta próbka ma rozmiar n
ocram
@ocram Jak obliczyć oczekiwaną wartość wariancji, jeśli mamy jedną próbkę? czego mi brakuje?
Quirik,
6

Ta odpowiedź wyjaśnia odpowiedź ocram. Głównym powodem (i powszechnym nieporozumieniem) dla jest to, że S 2 używa oszacowania ˉ Xmi[S.2)]σ2)S.2)X¯ które samo jest oszacowane na podstawie danych.

Jeśli przejdziesz przez derywację, zobaczysz, że wariancja tego oszacowania jest dokładnie tym, co daje dodatkowe - σ 2mi[(X¯-μ)2)] termin-σ2)n

Szorstki
źródło
5

Wyjaśnienie podane przez @Ocram jest świetne. Aby wyjaśnić to, co powiedział słowami: jeśli obliczymy dzieląc tylko przez n , (co jest intuicyjne) nasze oszacowanie s 2 będzie niedoszacowane. Aby to zrekompensować, dzielimy przez n - 1s2)ns2)n-1 .

Oto ćwiczenie: oblicz dyskretne prawdopodobieństwo z 2 wynikami, powiedzmy i P ( 6 ) = 0,75 . Znajdź μ i σ dla tego rozkładu. Obliczyć μ i σ dla średniej próbki, gdy n = 3 . Oblicz wszystkie możliwe próbki o wielkości n = 3 . Oblicz s 2 dla tych próbek i zastosuj odpowiednie częstotliwości. P.(2))=.25P.(6)=.75μσμσn=3)n=3)s2)

Czasami musisz ubrudzić sobie ręce.

Adam
źródło
dzięki za pomoc. Kilka pytań: W swoim ćwiczeniu: do jakiego rodzaju dystrybucji masz na myśli Binomial? Co masz na myśli, mówiąc o dyskretnym prawdopodobieństwie? Masz na myśli obliczyć wszystkie prawdopodobieństwa 2 i 6 dla różnych wielkości próby?
powyżej
1

Zasadniczo użycie „n” w mianowniku daje mniejsze wartości niż wariancja populacji, którą chcemy oszacować. Dzieje się tak zwłaszcza, gdy pobierane są małe próbki. W języku statystyki mówimy, że wariancja próby zapewnia „tendencyjne” oszacowanie wariancji populacji i należy ją uczynić „bezstronną”.

Ten film wideo odpowiednio odpowie na każdą część twojego pytania.

https://www.youtube.com/watch?v=xslIhnquFoE

Sahil Chaudhary
źródło