Mam pytanie dotyczące obliczania współczynnika James-Stein Kurczenie w 1977 Scientific American papierze Bradley Efron i Carl Morris, "Paradox Steina w Statistics" .
Zebrałem dane dla graczy baseballowych i jest podany poniżej:
Name, avg45, avgSeason
Clemente, 0.400, 0.346
Robinson, 0.378, 0.298
Howard, 0.356, 0.276
Johnstone, 0.333, 0.222
Berry, 0.311, 0.273
Spencer, 0.311, 0.270
Kessinger, 0.289, 0.263
Alvarado, 0.267, 0.210
Santo, 0.244, 0.269
Swoboda, 0.244, 0.230
Unser, 0.222, 0.264
Williams, 0.222, 0.256
Scott, 0.222, 0.303
Petrocelli, 0.222, 0.264
Rodriguez, 0.222, 0.226
Campaneris, 0.200, 0.285
Munson, 0.178, 0.316
Alvis, 0.156, 0.200
avg45
jest średnio po w nietoperzy jest oznaczona jako w wyrobie. avgSeason
jest koniec średniej sezonu.
James-Stein estymator na średnią ( ) uzyskuje się oo = °° r + C ( Y - ˉ y ) a Współczynnik kurczliwości C podaje się (strony 5 Scientific American 1977 artykułu) c = 1 - ( k - 3 ) σ 2
gdzie jest liczbą nieznanych średnich. Tutaj jest 18 graczy, więc k = 18 . Mogę obliczyć ∑ ( y - ˉ y ) 2 używając wartości. Ale nie wiem jak obliczyć σ 2 . Autorzy twierdzą, że c = 0,212 dla danego zestawu danych.avg45
Próbowałem przy użyciu zarówno i Ď 2 y dla Ď 2 , ale nie dać poprawną odpowiedź na c = 0,212
Czy ktoś może być na tyle uprzejmy, aby dać mi znać, jak obliczyć dla tego zestawu danych?
Odpowiedzi:
Parametr to (nieznana) wspólna wariancja elementów wektora, z których każdy, jak zakładamy, jest normalnie rozłożony. Dla danych baseball mamy 45 ⋅ Y i ~ b i n o m ( 45 , str I ) , a więc normalnie przybliżeniem rozkładu dwumianowego daje (z ^ p I = Y I )σ2 45⋅Yi∼binom(45,pi) pi^=Yi
Oczywiście w tym przypadku odchylenia nie są równe, ale gdyby była równa się do wspólnej wartości wówczas może oszacować jej zbiorczej estymatora Ď 2 = p ( 1 - p ) w którym p jest wielka średnią p =1
Możesz to sprawdzić za pomocą następującego kodu R. Oto dane:
a oto oszacowanie dla :σ2
który jest σ 2 ≈ 0,004332392 . Współczynnik skurczu w papierze jest wówczasσ^2≈0.004332392
źródło
Nie jestem pewien, oc = 0,212 , ale następujący artykuł zawiera znacznie bardziej szczegółowy opis tych danych:
Efron, B., i Morris, C. (1975). Analiza danych za pomocą estymatora Stein i jego uogólnień. Journal of the American Statistics Association, 70 (350), 311-319 (link do pdf)
lub bardziej szczegółowe
Efron, B., i Morris, C. (1974). Analiza danych za pomocą estymatora Stein i jego uogólnień. R-1394-OEO, The RAND Corporation, marzec 1974 r. (Link do pdf) .
Na stronie 312 zobaczysz, że Efron i Morris używają transformacji łukowo-sinowej tych danych, tak że wariancja średnich mrugnięć wynosi w przybliżeniu jedność:
Następnie używają c = .209 do obliczeniaz wartości, które możemy łatwo przekształcić wstecz:
Są to więc wartości estymatora Stein. Dla Clemente otrzymujemy .290, co jest dość zbliżone do .294 z artykułu z 1977 r.
źródło