Dlaczego

18

Sekwencja estymatorów Un dla parametru θ jest asymptotycznie normalny czy n(Unθ)N(0,v). (źródło) Następnie nazywamyvasymptotyczną wariancjąUn. Jeśli ta wariancja jest równawiązaniu Cramer-Rao, mówimy, że estymator / sekwencja jest asymptotycznie skuteczna.

Pytanie: Dlaczego używamy n zwłaszcza?

Wiem, że dla próbki średniej ten wybór normalizuje go. Ale ponieważ powyższe definicje dotyczą więcej niż średnia próbki, dlaczego nadal wybieramy normalizację doVar(X¯)=σ2n .n

bezradny
źródło
2
Dla dobrego estymatora, powinna mieć średnią θ , szacowany parametr, a wariancja U n powinna zbiegać się do 0 , to znaczy rozkład U n powinien być zbieżny do rozkładu zdegenerowanego z pojedynczym atomem w θ . Istnieje jednak wiele różnych sposobów, na jakie może wystąpić ta zbieżność, np. U nU ( θ - 1 / n , θ + 1 / n ) lub U nN ( θUnθUn0UnθUnU(θ1/n,θ+1/n) itd. Chcemy zastosować soubriquet w sposóbasymptotycznie normalnyw drugim przypadku, ale nie w pierwszym przypadku. UnN(θ,v/n)
Dilip Sarwate
1
Wydajne estymatory są asymptotycznie normalne. en.wikipedia.org/wiki/…
Khashaa
1
Czy to pytanie można by lepiej nazwać „normą asymptotyczną” niż „skutecznością asymptotyczną”? Nie jest dla mnie jasne, gdzie „wydajność” staje się merytorycznym aspektem pytania, a nie tylko kontekst, w którym napotkano „asymptotyczną normalność”.
Silverfish,
Trzeba tylko sprawdzić dowód na asymptotyczną normalność MLE! Pierwiastek kwadratowy ma uczynić centralne twierdzenie graniczne mające zastosowanie do średniej próbki! n
Megadeth,

Odpowiedzi:

15

Nie możemy tutaj wybierać . Czynnik „normalizujący” jest w istocie czynnikiem „stabilizującym wariancję na coś skończonego”, tak aby wyrażenie nie przechodziło do zera lub do nieskończoności, gdy wielkość próbki zmierza do nieskończoności, ale aby utrzymać rozkład na granicy.

Tak więc musi być w każdym przypadku czymkolwiek musi być. Oczywiście interesujące jest to, że w wielu przypadkach okazuje się, że musi być . (ale patrz także komentarz @ whubera poniżej).n

Standardowy przykład, w którym czynnikiem normalizującym musi być , a nie n jest wtedy, gdy mamy modeln

yt=βyt1+ut,y0=0,t=1,...,T

z białym szumem, i szacujemy nieznany β według zwykłych najmniejszych kwadratów.utβ

Jeśli tak się stanie, to prawdziwa wartość współczynnika wynosi , wtedy estymator OLS jest spójny i zbiega się w zwykłym |β|<1stawka n . n

Ale jeśli zamiast tego prawdziwa wartość wynosi (tzn. Mamy w rzeczywistości czysty losowy spacer), to estymator OLS jest spójny, ale zbiega się „szybciej”, w tempie n (jest to czasami nazywane „superkonsekwentnym” estymatorem - od czasu Chyba, tak wiele estymatorów zbiegają się w tempie β=1n ). W tym przypadku, w celu uzyskania jego (nienormalnych) rozkład asymptotyczną, żemająskali( p -p)przezN(jeśli skala tylkon
(β^β)n wyrażenie wyniesie zero). Hamilton ch 17ma szczegóły.n

Alecos Papadopoulos
źródło
2
Alecos, można wyjaśnić, co jest szacowana w modelu (gdzie przypuszczam chodziło y 0 = 0 i obserwacje są indeksowane 1 , 2 , itd.). Jest to, że w modelu y t = β r t - 1 + U t OLS estymator β zbiega przy szybkości yt=yt1+ut,u0=0y0=01,2,yt=βyt1+utβ^ dla| β| <1,ale gdykonwergencjaβ=1ma wartośćn, czy też w modeluyt=βy t - 1 +utkonwergencja ma zawsze wartośćn? Krótko mówiąc, jakie jest znaczenie zdania „iβ=1, tzn. Czysty losowy spacer”? n|β|<1β=1nyt=βyt1+utnβ=1
Dilip Sarwate,
@DilipSarwate Thanks. Zaktualizowano Wierzę, że teraz jest jasne.
Alecos Papadopoulos,
4
(+1) Warto zauważyć i pouczyć, że wybór (lubnlub cokolwiek może być odpowiednie) nie jest unikalne. Zamiast tego możesz użyćdowolnejfunkcjif(n)nnf(n) dla której wartość graniczna równa się jedności. Tylko w tym szerszym znaczeniuf„musi być tym, czym musi być”. f(n)/nf
whuber
1
@Khashaa OP zapytał o wydajność asymptotyczną, ale w trakcie procesu ujawniono, że OP mógł mieć błędne wrażenie na temat czynników „normalizujących”. Jest to kwestia bardziej fundamentalna, dlatego postanowiłem to uwzględnić w mojej odpowiedzi. W mojej odpowiedzi nic nie zostało powiedziane na temat wydajności.
Alecos Papadopoulos,
2
Być może warto wspomnieć w swojej odpowiedzi, że przypadek z zamiast nn
1

Byłeś na dobrej drodze z intuicyjną próbką średniej wariancji. Ponownie ustaw warunek:

n(Unθ)N(0,v)
(Unθ)N(0,v)n
UnN(θ,vn)

The last equation is informal. However, it's in some way more intuitive: you say that the deviation of Un from θ is becoming more like a normal distribution when n increases. The variance is shrinking, but the shape becomes closer to normal distribution.

In math they don't define the convergence to the changing right hand side (n is varying). That's why the same idea is expressed as the original condition, that you gave. In which the right hand side is fixed, and the left hand side converges to it.

Aksakal
źródło
You could explain how you do the "re-arrangements". Like what properties you apply.
mavavilj