W jaki sposób ARMA / ARIMA jest związana z modelowaniem efektów mieszanych?

14

W analizie danych panelowych wykorzystałem modele wielopoziomowe z efektami losowymi / mieszanymi, aby poradzić sobie z problemami autokorelacji (tj. Obserwacje są skupione w obrębie poszczególnych osób w czasie) z innymi parametrami dodanymi w celu dostosowania do niektórych specyfikacji czasu i szoków zainteresowania . Wydaje się, że ARMA / ARIMA ma na celu rozwiązanie podobnych problemów.

Zasoby, które znalazłem w Internecie, omawiają modele szeregów czasowych (ARMA / ARIMA) lub modele efektów mieszanych, ale poza tym, że bazują na regresji, nie rozumiem związku między nimi. Czy ktoś może chcieć używać ARMA / ARIMA z modelu wielopoziomowego? Czy istnieje sens, w którym oba są równoważne lub zbędne?

Odpowiedzi lub wskazówki do zasobów, które to omawiają, byłyby świetne.

Benjamin Mako Hill
źródło

Odpowiedzi:

11

Myślę, że najprostszym sposobem, aby na to spojrzeć, jest zauważenie, że ARMA i podobne modele są zaprojektowane do robienia innych rzeczy niż modele wielopoziomowe i do używania różnych danych.

Analiza szeregów czasowych zwykle ma długie szeregi czasowe (być może setki, a nawet tysiące punktów czasowych), a głównym celem jest sprawdzenie, jak zmienia się jedna zmienna w czasie. Istnieją wyrafinowane metody radzenia sobie z wieloma problemami - nie tylko autokorelacja, ale sezonowość i inne okresowe zmiany i tak dalej.

Modele wielopoziomowe są rozszerzeniami regresji. Zwykle mają stosunkowo niewiele punktów czasowych (chociaż mogą mieć wiele), a głównym celem jest zbadanie związku między zmienną zależną a kilkoma zmiennymi niezależnymi. Modele te nie są tak dobre w radzeniu sobie ze złożonymi relacjami między zmienną a czasem, częściowo dlatego, że zwykle mają mniej punktów czasowych (ciężko jest spojrzeć na sezonowość, jeśli nie ma wielu danych dla każdego sezonu).

Peter Flom - Przywróć Monikę
źródło
1
: Peter Bardzo ładne podsumowanie. Dodałbym tylko, że dane szeregów czasowych zwykle nie są „długie” w przypadku danych tygodniowych / miesięcznych / rocznych, ALE mogą być długie w przypadku danych dziennych / godzinowych / sekundowych.
IrishStat
3
Twoje wyjaśnienie jest całkiem dobre, w praktyce, choć dodam jeszcze niewielkie zastrzeżenie. Modele ARIMA można zaimplementować jako modele przestrzeni stanu (R arimarobi to pod maską), znane również jako dynamiczne modele liniowe (DLM). DLM są również rozszerzeniami regresji (w inny sposób niż efekty mieszane), więc sądzę, że istnieje głęboka zależność między ARIMA a modelami z efektami mieszanymi. Nie zmienia to różnic w praktyce , które dobrze podsumowujecie.
Wayne
1
t1
Benjamin: Cała idea statystyki polega na IDENTYFIKACJI STRUKTURY, a nie zakładaniu jej.
IrishStat
Myślę, że pełna odpowiedź może również wspomnieć o różnicy między szeregami czasowymi a danymi paneli. Jeśli dobrze rozumiem, ARIMA i podobne są używane przede wszystkim do danych, w których każda obserwacja ma tę samą zmienną w czasie. W wielopoziomowym modelu zmian zwykle skupiamy się na danych panelowych i modelujemy zmienną mierzoną w różnych osobach, grupach, krajach itp. W czasie. Dobrze?
Benjamin Mako Hill
7

ARMA / ARIMA to modele jednowymiarowe, które optymalizują sposób wykorzystania przeszłości pojedynczej serii do przewidywania tej pojedynczej serii. Modele te można rozszerzyć o empirycznie zidentyfikowane zmienne interwencyjne, takie jak impulsy, przesunięcia poziomu, sezonowe impulsy i lokalne trendy czasowe, ALE są one zasadniczo nieusuwalne, ponieważ nie istnieją żadne sugerowane przez użytkownika serie danych wejściowych. Wielowymiarowe rozszerzenie tych modeli nazywa się XARMAX lub bardziej ogólnie Modelami Funkcji Transferu, które wykorzystują struktury PDL / ADL na wejściach i wykorzystują dowolną potrzebną strukturę ARMA / ARIMA na pozostałej części. Modele te można również wzmocnić, włączając empirycznie identyfikowalne deterministyczne dane wejściowe. Zatem oba te modele można uznać za zastosowania do danych podłużnych (powtarzanych pomiarów). Teraz artykuł w Wikipedii na temat modeli wielopoziomowych odnosi się do ich zastosowania do szeregów czasowych / danych podłużnych poprzez przyjęcie pewnych prymitywnych / trywialnych, tj. nieanalitycznych struktur, takich jak „Najprostsze modele zakładają, że wpływ czasu jest liniowy. Można określić modele wielomianowe, aby umożliwić kwadratowe lub sześcienne skutki czasu” .

Można rozszerzyć model funkcji przenoszenia, aby objąć wiele grup, ewoluując w ten sposób do analizy szeregów czasowych w pulach przekrojów poprzecznych, w których odpowiednią strukturę (opóźnienia / odprowadzenia) można zastosować w połączeniu ze strukturą ARIMA w celu utworzenia zarówno modeli lokalnych, jak i modelu ogólnego.

IrishStat
źródło
Modele wielopoziomowe mogą również korzystać z ogólnej specyfikacji czasu, która dodaje manekiny za każdym razem, aby uchwycić średni efekt dla tego okresu.
Benjamin Mako Hill
1
: Benjamin Problem z rhat polega na tym, że zakładasz, że sezonowość jest deterministyczna, a na dodatek współczynniki sezonowości są niezmienne w czasie w porównaniu z sezonowym impulsem jednego z manekinów ISI-1, który nie miał wpływu po raz pierwszy okresy, ale zrobiły to później. Inną równie możliwą strukturą sezonową jest sezonowy komponent ARIMA, który wykorzystuje reakcję adaptacyjną do poprzednich sezonów w porównaniu z sugerowaną odpowiedzią STAŁĄ.
IrishStat