To pytanie może być zbyt proste. Jeśli chodzi o tymczasowy trend danych, chciałbym dowiedzieć się, w którym momencie następuje „nagła” zmiana. Na przykład na pierwszym rysunku pokazanym poniżej chciałbym znaleźć punkt zmiany za pomocą metody statystycznej. I chciałbym zastosować taką metodę w niektórych innych danych, których punkt zmiany nie jest oczywisty (jak na 2. rysunku). Czy istnieje zatem wspólna metoda do tego celu?
time-series
trend
change-point
użytkownik2230101
źródło
źródło
Odpowiedzi:
Jeśli obserwacje danych szeregów czasowych są skorelowane z wcześniejszymi obserwacjami, artykuł Chen i Liu (1993) może cię zainteresować. Opisuje metodę wykrywania przesunięć poziomów i tymczasowych zmian w ramach modeli szeregów czasowych autoregresyjnej średniej ruchomej.[ 1 ]
[1]: Chen, C. i Liu, LM. (1993),
„Joint Estimation of Model Parameters and Outlier Effects in Time Series”,
Journal of the American Statistics Association , 88 : 421, 284-297
źródło
Ten problem w statystykach jest określany jako (jednoczynnikowy) wykrywanie zdarzeń czasowych. Najprostszym pomysłem jest zastosowanie średniej ruchomej i odchylenia standardowego. Każdy odczyt, który jest „poza” 3 odchyleniami standardowymi (zasada praktyczna) jest uważany za „zdarzenie”. Istnieją oczywiście bardziej zaawansowane modele wykorzystujące HMM lub regresję. Oto wstępny przegląd tego pola .
źródło
źródło
Istnieje pokrewny problem dzielenia serii lub sekwencji na czary o idealnie stałych wartościach. Zobacz Jak mogę grupować dane liczbowe w naturalnie tworzące się „nawiasy”? (np. dochód)
Nie jest to ten sam problem, ponieważ pytanie nie wyklucza czarów z powolnym dryfowaniem w dowolnym kierunku lub we wszystkich kierunkach, ale bez gwałtownych zmian.
Bardziej bezpośrednią odpowiedzią jest stwierdzenie, że szukamy dużych skoków, więc jedynym prawdziwym problemem jest zdefiniowanie skoku. Pierwszym pomysłem jest więc spojrzenie na pierwsze różnice między sąsiednimi wartościami. Nie jest nawet jasne, że musisz to udoskonalić, usuwając najpierw hałas, ponieważ jeśli skoki nie można odróżnić od różnic w hałasie, z pewnością nie mogą być gwałtowne. Z drugiej strony pytający najwyraźniej chce, aby nagła zmiana obejmowała zarówno zmianę narastającą, jak i stopniową, więc wydaje się, że potrzebne jest pewne kryterium, takie jak wariancja lub zakres w oknach o stałej długości.
źródło
Obszarem statystyk, którego szukasz, jest analiza zmian. Jest tu strona internetowa , która daje przegląd obszaru, a także stronę z oprogramowaniem.
Jeśli jesteś
R
użytkownikiem, polecamchangepoint
pakiet zmian średnich istrucchange
pakiet zmian regresji. Jeśli chcesz być Bayesianem,bcp
pakiet też jest dobry.Ogólnie rzecz biorąc, musisz wybrać próg wskazujący siłę zmian, których szukasz. Istnieją oczywiście wybory progowe, które ludzie popierają w pewnych sytuacjach, a także można użyć asymptotycznych poziomów zaufania lub ładowania początkowego, aby uzyskać pewność siebie.
źródło
Ten problem wnioskowania ma wiele nazw, w tym punkty zmiany, punkty przełączania, punkty przerwania, regresja linii przerywanej, regresja łamanego pręta, regresja dwuliniowa, regresja liniowa fragmentaryczna, lokalna regresja liniowa, regresja segmentowa i modele nieciągłości.
Oto przegląd pakietów punktów zmiany z zaletami / wadami i sprawdzonymi przykładami. Jeśli znasz liczbę punktów wymiany a priori, sprawdź
mcp
pakiet. Najpierw symulujmy dane:Pierwszym problemem są trzy segmenty tylko przechwytujące:
Możemy wykreślić wynikowe dopasowanie:
Tutaj punkty zmiany są bardzo dobrze zdefiniowane (wąskie). Podsumujmy dopasowanie, aby zobaczyć ich wywnioskowane lokalizacje (
cp_1
icp_2
):Możesz wykonywać znacznie bardziej skomplikowane modele
mcp
, w tym modelowanie autoregresji rzędu N (przydatne w szeregach czasowych) itp. Oświadczenie: Jestem programistąmcp
.źródło