Każde stwierdzenie, które znajduję w estymatorze Jamesa-Steina zakłada, że oszacowane zmienne losowe mają tę samą wariancję (i jednostkę).
Ale wszystkie te przykłady wspominają również, że estymator JS może być używany do szacowania ilości, nie mając ze sobą nic wspólnego. Przykład wikipedia jest prędkością światła, spożycie herbaty w Tajwanie i wagi świń w Montanie. Ale przypuszczalnie twoje pomiary tych trzech wielkości miałyby różne „prawdziwe” wariancje. Czy to stanowi problem?
Wiąże się to z większym problemem koncepcyjnym, którego nie rozumiem, związanym z tym pytaniem: estymator Jamesa-Steina: W jaki sposób Efron i Morris obliczyli współczynnika kurczliwości dla swojego przykładu baseballu? cObliczamy współczynnik skurczu w następujący sposób:
Intuicyjnie sądzę, że termin jest w rzeczywistości - różny dla każdej szacowanej ilości. Ale dyskusja w tym pytaniu mówi tylko o wykorzystaniu połączonej wariancji ...σ 2 i
Byłbym bardzo wdzięczny, gdyby ktoś mógł wyjaśnić to zamieszanie!
źródło
Odpowiedzi:
Odpowiedź na to pytanie została wyraźnie udzielona w klasycznej serii artykułów na temat estymatora Jamesa-Steina w kontekście Empirical Bayes napisanych w latach 70. przez Efrona i Morrisa. Mam na myśli głównie:
Efron i Morris, 1973, Reguła estymacji Stein'a i jej konkurenci - podejście empiryczne Bayesa
Efron i Morris, 1975, Analiza danych z estymatorem Stein'a i jego uogólnienia
Efron i Morris, 1977, Paradoks Steina w statystyce
Artykuł z 1977 r. Jest nietechniczną ekspozycją, którą należy przeczytać. Tam przedstawiają przykład mrugnięcia bejsbolem (omówiony w wątku, do którego linkujesz); w tym przykładzie wariancje obserwacji rzeczywiście powinny być równe dla wszystkich zmiennych, a współczynnik skurczudo jest stały.
Podają jednak kolejny przykład, który ocenia wskaźniki toksoplazmozy w wielu miastach w Salwadorze. W każdym mieście ankietowano inną liczbę osób, dlatego można myśleć o indywidualnych obserwacjach (wskaźnik toksoplazmozy w każdym mieście) o różnych wariancjach (im niższa liczba ankietowanych osób, tym wyższa wariancja). Intuicja jest z pewnością taka, że punkty danych o niskiej wariancji (niska niepewność) nie muszą być tak mocno skurczone, jak punkty danych o dużej wariancji (wysoka niepewność). Wynik ich analizy pokazano na poniższym rysunku, na którym rzeczywiście można to zaobserwować:
Te same dane i analizy przedstawiono również w dużo bardziej technicznym artykule z 1975 r., Na znacznie bardziej eleganckiej figurze (niestety nie pokazując poszczególnych odchyleń), patrz sekcja 3:
Odpowiednią sekcją w artykule z 1973 r. Jest sekcja 8 i jest ona nieco trudniejsza do przeczytania. Co ciekawe, mają tam wyraźny komentarz do sugestii @guy w powyższych komentarzach:
źródło