Pytanie o przykładową funkcję autokowariancji

10

Czytam książkę do analizy szeregów czasowych, a wzór na próbkę autokowariancji jest zdefiniowany w książce jako:

γ^(h)=n1t=1nh(xt+hx¯)(xtx¯)

withdla . \ bar {x} to średnia.γ^(h)=γ^(h)h=0,1,...,n1x¯

Czy ktoś może wyjaśnić intuicyjnie, dlaczego dzielimy sumę przez n a nie przez nh ? Książka wyjaśnia, że ​​dzieje się tak, ponieważ powyższy wzór jest funkcją nieujemną i dlatego dzielenie przez n jest preferowane, ale nie jest to dla mnie jasne. Czy ktoś może to udowodnić, pokazać przykład lub coś takiego?

Dla mnie intuicyjną rzeczą byłoby na początku podzielenie przez nh . Czy jest to obiektywny lub stronniczy estymator autokowariancji?

jjepsuomi
źródło
1
Jeśli twoje szeregi czasowe to dokładnie przy czym wszystkie inne , lub są nieznane, wówczas suma musi koniecznie kończyć się przy gdy występuje w suma: następny termin (dla ), który zostałby włączony do sumy, zawierałby , a nie jest częścią próbki. x1,x2,,xnxii<1i>nt=nhxt+h=xnt=nh+1xnh+1+h=xn+1xn+1
Dilip Sarwate
@Dipip Nie sądzę, że o to chodzi: pytanie dotyczy tego, czy podzielić przez czy w definicji . nnhγ^
whuber

Odpowiedzi:

14

γ^ służy do tworzenia macierzy kowariancji: biorąc pod uwagę „czasy” , szacuje, że kowariancja wektora losowego (uzyskany w tym czasie z pola losowego) to macierz . W przypadku wielu problemów, takich jak przewidywanie, bardzo ważne jest, aby wszystkie takie macierze nie były jednostkowe. Jako domniemane macierze kowariancji, oczywiście nie mogą mieć żadnych ujemnych wartości własnych, skąd wszystkie muszą być określone dodatnio.t1,t2,,tkXt1,Xt2,,Xtk(γ^(titj),1i,jk)

Najprostsza sytuacja, w której rozróżnia się dwie formuły

γ^(h)=n1t=1nh(xt+hx¯)(xtx¯)

i

γ^0(h)=(nh)1t=1nh(xt+hx¯)(xtx¯)

pojawia się, gdy ma długość ; powiedzmy . Dla i można to łatwo obliczyćx2x=(0,1)t1=tt2=t+1

γ^0=(14141414),

co jest liczbą pojedynczą, podczas gdy

γ^=(14181814)

który ma wartości własne i , skąd jest pozytywnie określony.3/81/8

Podobne zjawisko ma miejsce dla , gdzie jest pozytywnie określony, ale przy zastosowaniu do czasów , powiedzmy - degeneruje się w macierz rangi (jej wpisy zmieniają się na przemian między a ).x=(0,1,0,1)γ^γ^0ti=(1,2,3,4)11/41/4

(Jest tutaj wzór: pojawiają się problemy dla dowolnego postaci .)x(a,b,a,b,,a,b)

W większości zastosowań seria obserwacji jest tak długa, że ​​dla większości zainteresowania - które są znacznie mniejsze niż - różnica między i nie ma znaczenia. Tak więc w praktyce rozróżnienie to nie jest niczym wielkim i teoretycznie potrzeba określenia pozytywnego zdecydowanie przewyższa wszelkie możliwe pragnienia obiektywnych szacunków.xthnn1(nh)1

Whuber
źródło
1
Myślę, że należy zauważyć, że oba estymatory są estymatorami stronniczymi, nawet jeśli podzielimy to przez nh.
Ran
@Ran Chociaż masz rację, że estymatory są stronnicze, nie zgadzam się, że jest to ważna kwestia: jak wspomniano w ostatnim akapicie, niewielki błąd systematyczny jest najmniejszym zmartwieniem. Bezstronny estymator, używając(nh1)1, niewiele różni się od γ^ lub γ^0.
whuber
2
Bardzo ładna odpowiedź +1. Być może warto dodać punkt, że , podczas gdy , więc gdy jest bliskie , estymator może być zmienny, podczas gdy będzie miał jednolicie małe fluktuacje próbkowania . Zobacz np. Priestly (1981) „Analiza spektralna i szeregi czasowe” p324, aby uzyskać szczegółowe omówienie tego punktuVγ^0(h)=O(1/(nh))Vγ^(h)=O(1/n)hnγ^0(h)γ^(h)h
Colin T Bowers