Mam macierz z dwiema kolumnami, które mają wiele cen (750). Na poniższym obrazku narysowałem resztki następującej regresji liniowej:
lm(prices[,1] ~ prices[,2])
Patrząc na obraz, wydaje się być bardzo silną autokorelacją reszt.
Jak mogę jednak sprawdzić, czy autokorelacja tych reszt jest silna? Jakiej metody powinienem użyć?
Dziękuję Ci!
acf()
), ale to po prostu potwierdzi to, co można zobaczyć na własne oczy: korelacje między opóźnionymi resztami są bardzo wysokie.qt(0.75, numberofobs)/sqrt(numberofobs)
Odpowiedzi:
Prawdopodobnie jest na to wiele sposobów, ale pierwszy, który przychodzi na myśl, opiera się na regresji liniowej. Możesz regresować kolejne reszty względem siebie i testować znaczny spadek. Jeśli występuje autokorelacja, powinna istnieć liniowa zależność między kolejnymi resztami. Aby zakończyć napisany kod, możesz:
mod2 jest regresją liniową błędu czasu , , względem błędu czasu , . jeśli współczynnik res [-1] jest znaczący, masz dowody autokorelacji w resztach.ε t t - 1 ε t - 1t εt t - 1 εt - 1
Uwaga: Domyślnie zakłada się, że reszty są autoregresyjne w tym sensie, że tylko jest ważny przy przewidywaniu . W rzeczywistości zależności mogą być dłuższe. W takim przypadku opisaną przeze mnie metodę należy interpretować jako jednoregulowe przybliżenie autoregresyjne do prawdziwej struktury autokorelacji w . ε t εεt - 1 εt ε
źródło
Użyj testu Durbin-Watson , zaimplementowanego w pakiecie lmtest .
źródło
Test DW lub test regresji liniowej nie są odporne na anomalie w danych. Jeśli masz impulsy, impulsy sezonowe, przesunięcia poziomu lub lokalne trendy czasowe, testy te są bezużyteczne, ponieważ te nieleczone składniki zwiększają wariancję błędów, powodując w ten sposób przesunięcie w dół testów, powodując (jak się okazało) niepoprawne przyjęcie hipotezy zerowej o braku autokorelacja. Przed tymi dwoma testami lub jakimkolwiek innym testem parametrycznym, który jestem świadomy, należy „udowodnić”, że średnia z reszt nie różni się statystycznie znacząco od 0,0 KAŻDEJ GDZIE, w przeciwnym razie podstawowe założenia są nieważne. Dobrze wiadomo, że jednym z ograniczeń testu DW jest założenie, że błędy regresji są zwykle rozkładane. Uwaga normalnie dystrybuowana oznacza między innymi: Brak anomalii (patrzhttp://homepage.newschool.edu/~canjels/permdw12.pdf ). Dodatkowo test DW testuje tylko autokorelację opóźnienia 1. Twoje dane mogą mieć efekt tygodniowy / sezonowy, a to nie byłoby zdiagnozowane, a ponadto, nieleczone, spowodowałoby odchylenie testu DW.
źródło