Jak stwierdzić, czy reszty są autokorelowane z grafiką

12

Kiedy wykonujesz regresję OLS i wykreślasz wynikowe reszty, w jaki sposób możesz stwierdzić, czy reszty są autokorelowane? Wiem, że istnieją na to testy (Durbin, Breusch-Godfrey), ale zastanawiałem się, czy możesz po prostu spojrzeć na wykres, aby ocenić, czy autokorelacja może stanowić problem (ponieważ dla heteroskedastyczności jest to dość łatwe).

nieznany z nazwiska
źródło

Odpowiedzi:

12

Nie tylko można spojrzeć na działce, myślę, że to generalnie lepszym rozwiązaniem. Testowanie hipotez w tej sytuacji odpowiada na złe pytanie.

Zwykle działaniem, na które należy patrzeć, byłaby funkcja autokorelacji (ACF) reszt.

Funkcja autokorelacji jest korelacją reszt (jako szeregu czasowego) z własnymi opóźnieniami.

Tutaj, na przykład, jest ACF pozostałości z małego przykładu z Montgomery i in

ACF resztek na sprzedaż napojów bezalkoholowych

Niektóre korelacje próbki (na przykład dla opóźnień 1,2 i 8) nie są szczególnie małe (a więc mogą mieć istotny wpływ na rzeczy), ale nie można ich również odróżnić od efektu hałasu (próbka jest bardzo mała).

Edycja: Oto wykres ilustrujący różnicę między serią nieskorelowaną i wysoce skorelowaną (w rzeczywistości niestacjonarną)

Biały hałas i swobodny spacer

Górny wykres to biały szum (niezależny). Niższy to chód losowy (którego różnice są oryginalnymi seriami) - ma bardzo silną autokorelację.

Glen_b - Przywróć Monikę
źródło
1
Dziękuję za odpowiedź. Kiedy patrzysz na wykresy na wiki ( en.wikipedia.org/wiki/File:Acf_new.svg ), czy możesz stwierdzić na podstawie górnego wykresu (nie wykresu ACF), że reszty są autoklawowane?
John Doe
Powiedziałbym: „hmm, wygląda nieco cyklicznie ... może być autokorelacją, może nie. Jak wygląda ACF?”
Glen_b
1
Dobrze, ale czy mógłbyś rozwinąć tę kwestię: Na przykład znalazłem to pytanie: stats.stackexchange.com/questions/14914/… Najwyraźniej istnieje autokorelacja. Czego konkretnie szukam, aby dojść do tego wniosku?
John Doe
Jasne, że pokazuje coś, co wytworzy pozytywną autokorelację (choć prawdopodobnie sprowadziłbym to do trendu, a także zależności od trendu). Zastanów się - jeśli obserwacje są niezależne, pomyśl o szansie, że ich długi okres będzie po jednej lub drugiej stronie średniej, a żadna po drugiej. Myślę, że najlepszą pierwszą opcją jest symulacja danych, które są autokorelowane na różnych poziomach i spojrzenie na nie.
Glen_b
1
Rozumiem, że nie masz autokorelacji, gdy dane są po prostu losowo dystrybuowane. Ale czy jako wskaźnik autokorelacji wystarcza, gdy dane nie są losowo dystrybuowane, czy też jest to rodzaj wzorca (np. Po punkcie danych o wysokiej wartości następuje wiele punktów danych o wysokiej wartości)?
John Doe
2

Nie jest niczym niezwykłym, jeśli 5% lub mniej wartości autokorelacji wykracza poza przedziały, ponieważ może to być spowodowane zmiennością próbkowania. Jedną praktyką jest utworzenie wykresu autokorelacji dla pierwszych 20 wartości i sprawdzenie, czy więcej niż jedna wartość nie mieści się w dozwolonych przedziałach.

Lew
źródło