Ustalenie prawdziwej średniej z głośnych obserwacji

13

Mam duży zestaw punktów danych w postaci (średnia, stdev). Chciałbym zredukować to do jednego (lepszego) środka i (miejmy nadzieję) mniejszego odchylenia standardowego.

Oczywiście mógłbym po prostu obliczyć , jednak nie bierze to pod uwagę faktu, że niektóre punkty danych są znacznie dokładniejsze niż inne.datameanN

Krótko mówiąc, chciałbym wykonać średnią ważoną tych punktów danych, ale nie wiem, jaka powinna być funkcja ważenia pod względem odchylenia standardowego.

Michael
źródło

Odpowiedzi:

24

Szukasz estymatora liniowego dla średniej μ formy

μ^=i=1nαixi

gdzie to wagi, a to obserwacje. Celem jest znalezienie odpowiednich wartości dla wag. Niech będzie prawdziwym standardowym odchyleniem , które może, ale nie musi, pokrywać się z szacowanym odchyleniem standardowym, które prawdopodobnie masz. Załóżmy, że obserwacje są obiektywne; to znaczy, ich oczekiwania są równe średniej . W tych warunkach możemy obliczyć, że oczekiwanie jestαixiσixiμμ^

E[μ^]=i=1nαiE[xi]=μi=1nαi

i (pod warunkiem, że są nieskorelowane) wariancja tego estymatora wynosixi

Var[μ^]=i=1nαi2σi2.

W tym momencie wiele osób wymaga, aby estymator był bezstronny; to znaczy, że chcemy, aby jego oczekiwania były równe prawdziwemu środkowi. Oznacza to, że wagi muszą sumować się do jedności. Z zastrzeżeniem tego ograniczenia dokładność estymatora (mierzona średnim błędem kwadratowym) jest optymalizowana przez minimalizację wariancji. Unikalnym rozwiązaniem (łatwym do uzyskania za pomocą mnożnika Lagrange'a lub poprzez reinterpretację sytuacji geometrycznej jako problem minimalizacji odległości) jest to, że wagi muszą być proporcjonalne do . αi1/σi2 Ograniczenie sumy do jedności określa ich wartości, ustępując

μ^=i=1nxi/σi2i=1n1/σi2

i

Var[μ^]=1i=1n1/σi2=1n(1ni=1n1σi2)1.

W słowach,

estymator obiektywny minimalnej wariancji średniej jest uzyskiwany przez uczynienie wag odwrotnie proporcjonalnymi do wariancji; wariancja tego estymatora jest razy średnia harmoniczna wariancji.1/n

Zwykle nie znamy prawdziwych wariancji . Wszystko, co możemy zrobić, to uczynić wagi odwrotnie proporcjonalnymi do szacowanych odchyleń (kwadraty standardowych odchyleń) i ufać, że to zadziała dobrze.σi

Whuber
źródło
1
i związane z tą odpowiedzią, również z whuber: stats.stackexchange.com/questions/9071/…
Henry
Co by się stało, gdybyśmy nie „zakładali, że obserwacje są obiektywne”? Z tym stwierdzeniem mówisz, że jeśli do obserwacji dodamy nieskończone losowe pomiary indywidualne , otrzymamy średnią mu? xi
user1420303