Czytam książkę do analizy szeregów czasowych, a wzór na próbkę autokowariancji jest zdefiniowany w książce jako:
withdla . \ bar {x} to średnia.
Czy ktoś może wyjaśnić intuicyjnie, dlaczego dzielimy sumę przez a nie przez ? Książka wyjaśnia, że dzieje się tak, ponieważ powyższy wzór jest funkcją nieujemną i dlatego dzielenie przez jest preferowane, ale nie jest to dla mnie jasne. Czy ktoś może to udowodnić, pokazać przykład lub coś takiego?
Dla mnie intuicyjną rzeczą byłoby na początku podzielenie przez . Czy jest to obiektywny lub stronniczy estymator autokowariancji?
time-series
probability
mathematical-statistics
jjepsuomi
źródło
źródło
Odpowiedzi:
Najprostsza sytuacja, w której rozróżnia się dwie formuły
i
pojawia się, gdy ma długość ; powiedzmy . Dla i można to łatwo obliczyćx 2 x=(0,1) t1=t t2=t+1
co jest liczbą pojedynczą, podczas gdy
który ma wartości własne i , skąd jest pozytywnie określony.3/8 1/8
Podobne zjawisko ma miejsce dla , gdzie jest pozytywnie określony, ale przy zastosowaniu do czasów , powiedzmy - degeneruje się w macierz rangi (jej wpisy zmieniają się na przemian między a ).x=(0,1,0,1) γˆ γˆ0 ti=(1,2,3,4) 1 1/4 −1/4
(Jest tutaj wzór: pojawiają się problemy dla dowolnego postaci .)x (a,b,a,b,…,a,b)
W większości zastosowań seria obserwacji jest tak długa, że dla większości zainteresowania - które są znacznie mniejsze niż - różnica między i nie ma znaczenia. Tak więc w praktyce rozróżnienie to nie jest niczym wielkim i teoretycznie potrzeba określenia pozytywnego zdecydowanie przewyższa wszelkie możliwe pragnienia obiektywnych szacunków.xt h n n−1 (n−h)−1
źródło