Mam prosty szereg czasowy z 5-10 punktami danych na zestaw danych w regularnych odstępach czasu. Zastanawiam się, jaki jest najlepszy sposób ustalenia, czy dwa zestawy danych są różne. Czy powinienem wypróbować testy t dla każdego punktu danych, czy spojrzeć na obszar pod krzywymi, czy może istnieje jakiś model wielowymiarowy, który działałby lepiej?
16
Odpowiedzi:
Musisz dokładnie określić, co rozumiesz przez „inny”. Będziesz także musiał określić, jakie założenia zamierzasz poczynić w odniesieniu do struktury korelacji szeregowej w ramach każdego szeregu czasowego.
Dzięki testom t porównujesz średnią dla każdej grupy i zakładasz, że grupy składają się z niezależnych obserwacji z jednakowymi wariancjami (ta ostatnia jest czasem rozluźniona). Podczas testowania szeregów czasowych założenie niezależności jest zwykle nieuzasadnione, ale wtedy należy zastąpić je określoną strukturą korelacji - np. Można założyć, że szeregi czasowe przebiegają zgodnie z procesami AR (1) z jednakową autokorelacją. W konsekwencji nawet porównywanie średnich dwóch lub więcej szeregów czasowych jest znacznie trudniejsze niż w przypadku niezależnych danych.
Dokładnie sprecyzowałem, jakie założenia chciałem przyjąć w odniesieniu do każdej serii czasowej i co chciałem porównać, a następnie wykorzystałem parametryczny bootstrap (oparty na założonym modelu) do przeprowadzenia testu.
źródło
Być może chcesz powtarzać miary anova. Pozwala ci porównać podmioty (czynniki między podmiotami), biorąc jednocześnie skorelowaną strukturę „szeregów czasowych” na podmiot (czynnik wewnątrz podmiotu). Jest to łatwa, ale przestarzała metoda, którą można znaleźć w kontekście „ogólnych modeli liniowych”, wymaga ona dodatkowych funkcji (np. Sferyczności). Innym sposobem mogą być mieszane modele liniowe, które pozwalają na bardziej ogólne struktury korelacji (nawet AR (1), jak sugerował Rob) i niezrównoważone dane.
źródło
Jeśli chcesz założyć prosty trend liniowy, możesz wziąć różnicę każdego zestawu danych w różnych punktach czasowych i przetestować, czy nachylenie linii wynosi zero.
-Ralph Winters
źródło