James-Stein Estimator z nierównymi wariancjami

11

Każde stwierdzenie, które znajduję w estymatorze Jamesa-Steina zakłada, że ​​oszacowane zmienne losowe mają tę samą wariancję (i jednostkę).

Ale wszystkie te przykłady wspominają również, że estymator JS może być używany do szacowania ilości, nie mając ze sobą nic wspólnego. Przykład wikipedia jest prędkością światła, spożycie herbaty w Tajwanie i wagi świń w Montanie. Ale przypuszczalnie twoje pomiary tych trzech wielkości miałyby różne „prawdziwe” wariancje. Czy to stanowi problem?

Wiąże się to z większym problemem koncepcyjnym, którego nie rozumiem, związanym z tym pytaniem: estymator Jamesa-Steina: W jaki sposób Efron i Morris obliczyli współczynnika kurczliwości dla swojego przykładu baseballu? σ2) cObliczamy współczynnik skurczu w następujący sposób:do

do=1-(k-3))σ2)(y-y¯)2)

Intuicyjnie sądzę, że termin jest w rzeczywistości - różny dla każdej szacowanej ilości. Ale dyskusja w tym pytaniu mówi tylko o wykorzystaniu połączonej wariancji ...σ 2 iσ2)σja2)

Byłbym bardzo wdzięczny, gdyby ktoś mógł wyjaśnić to zamieszanie!

exp1orer
źródło
3
Jeśli wariancja to , możemy po prostu pomnożyć w lewo przez aby wrócić do problemu Jamesa-Steina. Jeśli jest nieznane, ale każda „obserwacja” w problemie jest średnią próbną obliczoną na podstawie obserwacji , możemy oszacować pomocą pewnego i mieć nadzieję, że otrzymamy również sytuację Jamesa-Steina, jeśli pomnożymy przez zamiast tego . D - 1 / 2, D m ı D D D - 1 / 2re=diag(σ12),,σn2))re-1/2)remjarere^re^-1/2)
facet
2
@guy: jest to rozsądna sugestia (+1), jednak spowoduje to taki sam współczynnik kurczenia dla wszystkich zmiennych, podczas gdy ktoś chciałby zmniejszać zmienne w różny sposób, w zależności od ich wariancji / niepewności. Zobacz odpowiedź, którą właśnie opublikowałem.
ameba
1
@amoeba Sure; Nie sugerowałem, że mój estymator jest praktyczny, tylko że ilustruje, dlaczego ludzie mówią rzeczy OP wspomniane w jego drugim akapicie.
facet

Odpowiedzi:

6

Odpowiedź na to pytanie została wyraźnie udzielona w klasycznej serii artykułów na temat estymatora Jamesa-Steina w kontekście Empirical Bayes napisanych w latach 70. przez Efrona i Morrisa. Mam na myśli głównie:

  1. Efron i Morris, 1973, Reguła estymacji Stein'a i jej konkurenci - podejście empiryczne Bayesa

  2. Efron i Morris, 1975, Analiza danych z estymatorem Stein'a i jego uogólnienia

  3. Efron i Morris, 1977, Paradoks Steina w statystyce

Artykuł z 1977 r. Jest nietechniczną ekspozycją, którą należy przeczytać. Tam przedstawiają przykład mrugnięcia bejsbolem (omówiony w wątku, do którego linkujesz); w tym przykładzie wariancje obserwacji rzeczywiście powinny być równe dla wszystkich zmiennych, a współczynnik skurczu do jest stały.

Podają jednak kolejny przykład, który ocenia wskaźniki toksoplazmozy w wielu miastach w Salwadorze. W każdym mieście ankietowano inną liczbę osób, dlatego można myśleć o indywidualnych obserwacjach (wskaźnik toksoplazmozy w każdym mieście) o różnych wariancjach (im niższa liczba ankietowanych osób, tym wyższa wariancja). Intuicja jest z pewnością taka, że ​​punkty danych o niskiej wariancji (niska niepewność) nie muszą być tak mocno skurczone, jak punkty danych o dużej wariancji (wysoka niepewność). Wynik ich analizy pokazano na poniższym rysunku, na którym rzeczywiście można to zaobserwować:

wprowadź opis zdjęcia tutaj

Te same dane i analizy przedstawiono również w dużo bardziej technicznym artykule z 1975 r., Na znacznie bardziej eleganckiej figurze (niestety nie pokazując poszczególnych odchyleń), patrz sekcja 3:

wprowadź opis zdjęcia tutaj

Xja|θjaN.(θja,reja)θjaN.(0,ZA)
ZAreja=11/(1+ZA)(k-2))/Xjot2)θja
θ^ja=(1-11+ZA)Xja=(1-k-2)Xjot2))Xja,

reja1

θ^ja=(1-rejareja+ZA)Xja
ZAZA^

rejotZA^jak

Odpowiednią sekcją w artykule z 1973 r. Jest sekcja 8 i jest ona nieco trudniejsza do przeczytania. Co ciekawe, mają tam wyraźny komentarz do sugestii @guy w powyższych komentarzach:

x~ja=reja-1/2)xja,θ~ja=reja-1/2)θjax~jaN.(θ~ja,1)θja

θ^ja=(1-k-2)[Xjot2)/rejot])Xja.
Xja

ZA^ja

ameba
źródło