Próbuję dowiedzieć się, w jaki sposób R oblicza autokorelację lag-k (najwyraźniej jest to ta sama formuła stosowana przez Minitab i SAS), dzięki czemu mogę ją porównać do korzystania z funkcji CORREL programu Excel zastosowanej do serii i jej wersji z opóźnieniem k. R i Excel (przy użyciu CORREL) dają nieco inne wartości autokorelacji.
Chciałbym również dowiedzieć się, czy jedno obliczenie jest bardziej poprawne niż drugie.
r
sas
autocorrelation
excel
Galit Shmueli
źródło
źródło
R
Formuła jest dalej analizowana i wyjaśniona na stronie stats.stackexchange.com/questions/81754/… .Odpowiedzi:
Dokładne równanie podano w: Venables, WN i Ripley, BD (2002) Modern Applied Statistics with S. Fourth Edition. Springer-Verlag. Dam ci przykład:
I tak dalej (np.
res[1:47]
Ires[4:50]
dla opóźnienia 3).źródło
Naiwnym sposobem obliczania automatycznej korelacji (i ewentualnie tego, co wykorzystuje Excel) jest utworzenie 2 kopii wektora, a następnie usunięcie pierwszego n elementów z pierwszej kopii i ostatnich n elementów z drugiej kopii (gdzie n jest opóźnieniem obliczam z). Następnie przekaż te 2 wektory do funkcji, aby obliczyć korelację. Ta metoda jest OK i da rozsądną odpowiedź, ale ignoruje fakt, że 2 porównywane wektory są tak naprawdę miarami tego samego.
Udoskonalona wersja (jak pokazuje Wolfgang) jest podobną funkcją do regularnej korelacji, z tym wyjątkiem, że wykorzystuje cały wektor do obliczenia średniej i wariancji.
źródło