Jakie są wymagania dotyczące stacjonarności stosowania regresji z błędami ARIMA (regresja dynamiczna) do wnioskowania?
W szczególności, mam niestacjonarne bezstopniowej wynik , A niestacjonarnym predyktor ciągły x i zmienny obojętne seria leczenia x b . Chciałbym wiedzieć, czy leczenie było skorelowane ze zmianą zmiennej wynikowej, która jest o więcej niż dwa błędy standardowe od zmiany zerowej.
Nie jestem pewien, czy muszę różnicować te serie przed wykonaniem regresji przy pomocy modelowania błędów ARIMA. W odpowiedzi na inne pytanie IrishStat stwierdza, że while the original series exhibit non-stationarity this does not necessarily imply that differencing is needed in a causal model.
następnie dodaje to unwarranted usage [of differencing] can create statistical/econometric nonsense
.
SAS Podręcznik użytkownika sugeruje, że to jest w porządku, aby pasowały modeli regresji z błędami ARIMA do niestacjonarnego serii bez różnicowych tak długo, jak pozostałości są niestacjonarne:
Należy pamiętać, że wymóg stacjonarności dotyczy serii hałasu. Jeśli nie ma zmiennych wejściowych, szeregi odpowiedzi (po różnicowaniu i minus średni termin) i szeregi szumowe są takie same. Jeśli jednak są wejścia, szereg szumów jest resztkowy po usunięciu efektu wejść.
Nie ma wymogu, aby szereg wejściowy był nieruchomy. Jeśli dane wejściowe są niestacjonarne, serie odpowiedzi będą niestacjonarne, nawet jeśli proces szumu może być stacjonarny.
Gdy używane są niestacjonarne serie wejściowe, można najpierw dopasować zmienne wejściowe bez modelu ARMA dla błędów, a następnie rozważyć stacjonarność reszt przed zidentyfikowaniem modelu ARMA dla części szumowej.
Z drugiej strony Rob Hyndman i George Athanasopoulos twierdzą :
Czy te porady wzajemnie się wykluczają? Jak postępować zastosowany analityk?
Odpowiedzi:
Moje czytanie tekstu SAS odpowiada Hyndmanowi i Athansopoulosowi.
W skrócie: Idź z Hyndmanem i Athansopoulos.
Pierwsze dwa akapity tekstu SAS wydają się po prostu mówić o regresji bez ARiMR.
Ostatni akapit tekstu SAS wydaje się odpowiadać ostatniemu akapitowi Hyndman i Athansolpoulos.
W odniesieniu do komentarza: „nieuzasadnione użycie [różnicowania] może stworzyć nonsens statystyczny / ekonometryczny”
Zgaduję, że to jest różnica, gdy nie ma root roota.
W odniesieniu do komentarza: „chociaż oryginalne serie wykazują niestacjonarność, niekoniecznie oznacza to, że w modelu przyczynowym konieczne jest różnicowanie”.
Myślę że jest to zgodne z drugim akapitem Hyndman i Athansopoulos.
Zauważ, że do tej pory omawialiśmy różnicowanie niesezonowe. Istnieje również różnicowanie sezonowe. Istnieją na to testy, takie jak OCSB, HEGY i Kunst (1997). Pamiętam, że D. Osborne napisał kiedyś, że lepiej jest różnicować sezonowo, gdy szereg czasowy jest „na granicy”.
Podsumowując, powinno to być twoje podejście:
źródło
Według Davida Gilesa „jeśli testy, których użyłeś do testowania stacjonarności / niestacjonarności, doprowadziły cię do błędnego wniosku, różnicowanie wszystkiego jest konserwatywnym, ale względnie bezpiecznym sposobem postępowania. Nie możesz nieświadomie zawieść różnicując zmienną, którą jest I (1). „Koszty” zrobienia tego są znaczne. Z drugiej strony niepotrzebne różnicowanie zmiennej, którą w rzeczywistości ja (0) powoduje stosunkowo niski „koszt”. http://davegiles.blogspot.com/2015/04/question-from-reader.html
źródło