Test statystyczny, aby sprawdzić, kiedy zaczynają się rozchodzić dwie podobne serie czasowe

10

Od tytułu chciałbym wiedzieć, czy istnieje test statystyczny, który może mi pomóc zidentyfikować znaczącą rozbieżność między dwoma podobnymi szeregami czasowymi. W szczególności, patrząc na poniższy rysunek, chciałbym wykryć, że szereg zaczyna się rozchodzić w czasie t1, tj. Kiedy różnica między nimi zaczyna być znacząca. Co więcej, wykryłbym również, kiedy różnica między seriami powraca do nieistotnych.

Czy istnieje jakiś przydatny test statystyczny, aby to zrobić?

wprowadź opis zdjęcia tutaj

Ugo Giordano
źródło

Odpowiedzi:

7

Przychodzi mi na myśl kilka sposobów. Pierwszym jest wzięcie różnicy między dwiema seriami i stworzenie „nowej serii”. Przeanalizuj tę serię i empirycznie zidentyfikuj impulsy, zmiany poziomów / trendy czasu lokalnego i możliwy komponent ARIMA. Wyniki będą / mogą sugerować każdą możliwą do zidentyfikowania rozbieżność. Drugim podejściem jest zbudowanie wspólnego modelu ARIMA dla obu szeregów czasowych i wykorzystanie testu CHOW do testowania parametrów istotnych statystycznie.

IrishStat
źródło
1

Innym podejściem, które może działać, jest rozważenie algorytmów wykrywania zmian.

Pierwszym pomysłem jest zastosowanie metody wykrywania zmian, takiej jak CUSUM, w obu seriach i porównanie punktów zmiany. W twoim przykładzie jest bardzo prawdopodobne, że czerwona seria da punkt zmiany w t1, podczas gdy żółta nie. Co ciekawe, zarówno czerwony, jak i żółty prawdopodobnie zapewnią punkt zmiany przy pierwszym uderzeniu krzywej (w zależności od wrażliwości parametrów CUSUM), ale tak naprawdę nie masz nic przeciwko, ponieważ zachowują się podobnie.

oDDsKooL
źródło
1

Niektóre opcje, które warto rozważyć:

  1. Jeśli chcesz zidentyfikować istotną różnicę, wykres statystycznej kontroli procesu (SPC) z wykorzystaniem reguł Western Electric może również pomóc w wykryciu, że ma ona miejsce. Jak sugeruje @IrishStat, najlepiej zacząć od wykresu różnicę między dwoma szeregami czasowymi. W takim przypadku dobrze jest zastosować reguły SPC oparte na analizie stabilnego okresu dwóch szeregów czasowych.

https://en.wikipedia.org/wiki/Western_Electric_rules

  1. Bardziej szczegółowym podejściem pragmatycznym jest chronostatystyka, która zbiera szeroką akceptację w przemyśle wydobywczym w celu identyfikacji zmian i specyficznych cech hałasu w danych szeregów czasowych. Jak możesz sobie wyobrazić, w środowisku, w którym interesuje Cię 0,001% materiału, należy rozumieć niepewność pobierania próbek i zmienność procesu, aby wiedzieć, czy występują różnice w dwóch szeregach czasowych.

Jako inżynier procesu wydobywczego jestem przyzwyczajony do zajmowania się danymi z szeregów czasowych, które są znacznie głośniejsze niż to, a chronostatystyka (zwolennicy to Pierre Gy i Francis Pitard) pozwala zidentyfikować błędy wprowadzone przez technikę próbkowania danych i inne aspekty danych zebranie. Bardziej dostępne artykuły (tj. Łatwiejsze dla nieprofesjonalnych statystyk) zostały napisane przez Tima Napiera-Munna, który ma bardzo oparte na aplikacji podejście do oceny danych szeregów czasowych.

Nie znam żadnych artykułów o otwartym kodzie źródłowym, ale obaj ci autorzy opublikowali za pośrednictwem Elseviera.

MarkR
źródło