Przez jakiś czas walczyłem ze stacjonarnością w głowie ... Czy tak o tym sądzisz? Wszelkie uwagi i dalsze przemyślenia będą mile widziane.
Proces stacjonarny to taki, który generuje wartości szeregów czasowych takie, że średnia rozkład i wariancja są utrzymywane na stałym poziomie. Ściśle mówiąc, jest to znane jako słaba forma stacjonarności lub kowariancja / średnia stacjonarność.
Słaba forma stacjonarności występuje, gdy szeregi czasowe mają stałą średnią i zmienność w czasie.
Mówiąc prościej, praktycy twierdzą, że stacjonarne szeregi czasowe to te bez trendu - oscylują wokół stałej średniej i mają stałą wariancję.
Kowariancja między różnymi opóźnieniami jest stała, nie zależy od absolutnej lokalizacji w szeregach czasowych. Na przykład kowariancja między ti t-1 (opóźnienie pierwszego rzędu) powinna być zawsze taka sama (dla okresu od 1960–1970 tak samo jak dla okresu od 1965–1975 lub dowolnego innego okresu).
W procesach niestacjonarnych nie ma długoterminowego środka, do którego powraca seria; dlatego mówimy, że niestacjonarne szeregi czasowe nie oznaczają powrotu. W takim przypadku wariancja zależy od absolutnej pozycji w szeregach czasowych, a wariancja zmienia się w nieskończoność wraz z upływem czasu. Technicznie rzecz biorąc, autokorelacje nie rozpadają się z czasem, ale w małych próbkach znikają - choć powoli.
W procesach stacjonarnych wstrząsy są tymczasowe i z czasem rozpraszają się (tracą energię). Po pewnym czasie nie przyczyniają się do nowych wartości szeregów czasowych. Na przykład coś, co wydarzyło się w dzienniku (wystarczająco długo), takie jak II wojna światowa, miało wpływ, ale, jeśli dzisiejsze szeregi czasowe są takie same, jak gdyby II wojna światowa nigdy się nie wydarzyła, powiedzielibyśmy, że szok stracił energię lub rozproszone. Stacjonarność jest szczególnie ważna, ponieważ wiele klasycznych teorii ekonometrycznych wywodzi się z założeń stacjonarności.
Silną formą stacjonarności jest sytuacja, gdy rozkład szeregów czasowych jest dokładnie taki sam jak czas koryta. Innymi słowy, rozkład pierwotnych szeregów czasowych jest dokładnie taki sam jak opóźniony szereg czasowy (o dowolną liczbę opóźnień) lub nawet podsegmenty szeregów czasowych. Na przykład silna forma sugeruje również, że rozkład powinien być taki sam nawet dla podsegmentów 1950–1960, 1960–1970 lub nawet nakładających się okresów, takich jak 1950–1960 i 1950–1980. Ta forma stacjonarności nazywa się silna, ponieważ nie zakłada żadnego rozkładu. Mówi tylko, że rozkład prawdopodobieństwa powinien być taki sam. W przypadku słabej stacjonarności rozkład określiliśmy na podstawie jego średniej i wariancji. Możemy to uprościć, ponieważ domyślnie przyjęliśmy rozkład normalny, a rozkład normalny jest w pełni określony przez jego średnią i wariancję lub odchylenie standardowe. To nic innego, jak powiedzenie, że miara prawdopodobieństwa sekwencji (w szeregach czasowych) jest taka sama, jak w przypadku opóźnionej / przesuniętej sekwencji wartości w tych samych szeregach czasowych.
źródło
Odpowiedzi:
Przede wszystkim należy zauważyć, że stacjonarność jest własnością procesu, a nie szeregu czasowego. Rozważasz zestaw wszystkich szeregów czasowych wygenerowanych przez proces. Jeśli właściwości statystyczne¹ tego zestawu (średnia, wariancja,…) są stałe w czasie, proces nazywa się stacjonarny. Ściśle mówiąc, nie można powiedzieć, czy dany szereg czasowy został wygenerowany przez proces stacjonarny (jednak przy pewnych założeniach możemy zgadywać).
Bardziej intuicyjnie, stacjonarność oznacza, że nie ma żadnych wyróżniających się punktów w czasie dla twojego procesu (wpływających na właściwości statystyczne twojej obserwacji). To, czy odnosi się to do danego procesu, zależy przede wszystkim od tego, co uważasz za stałe lub zmienne w swoim procesie, tj. Od tego, co zawiera Twój zespół.
Typową przyczyną niestacjonarności są parametry zależne od czasu - które pozwalają odróżnić punkty czasowe według wartości parametrów. Inną przyczyną są ustalone warunki początkowe.
Rozważ następujące przykłady:
Hałas dochodzący do mojego domu z jednego przejeżdżającego samochodu w danym momencie nie jest procesem stacjonarnym. Na przykład średnia amplituda² jest najwyższa, gdy samochód znajduje się bezpośrednio obok mojego domu.
Hałas docierający do mojego domu generalnie z ruchu ulicznego jest procesem stacjonarnym, jeśli zignorujemy zależność natężenia ruchu od czasu (np. Mniejszy ruch w nocy lub w weekendy). Nie ma już żadnych wyróżnionych punktów w czasie. Chociaż mogą występować silne wahania poszczególnych szeregów czasowych, znikają one, gdy rozważę zestaw wszystkich realizacji tego procesu.
Jeśli uwzględnimy znany wpływ na natężenie ruchu, np. Że ruch jest mniejszy w nocy, proces ten znowu nie jest stacjonarny: średnia amplituda² zmienia się wraz z rytmem dnia. Każdy punkt w czasie wyróżnia się porą dnia.
Pozycja pojedynczego pieprzu w garnku z wrzącą wodą jest procesem stacjonarnym (ignorując utratę wody z powodu parowania). Nie ma żadnych wyróżnionych punktów w czasie.
¹ Ze względów praktycznych jest to czasami sprowadzone do średniej i wariancji (słaba stacjonarność), ale nie uważam tego za pomocne w zrozumieniu tego pojęcia. Zignoruj słabą stacjonarność, dopóki nie zrozumiesz stacjonarności.
² Co oznacza średnią głośność, ale standardowe odchylenie rzeczywistego sygnału dźwiękowego (tutaj nie przejmuj się tym zbytnio).
źródło
Dla jasności dodam, że każdy szereg czasowy, w którym punkty danych są normalnie rozmieszczone w czasie ze stałą średnią, a wariancja jest uważany za silny stacjonarny szereg czasowy, ponieważ biorąc pod uwagę średnią i odchylenie standardowe, rozkład normalny zawsze będzie miał tę samą krzywą rozkładu prawdopodobieństwa ( dane wejściowe do równania normalnego zależą tylko od średniej i odchylenia standardowego).
Nie dzieje się tak na przykład w przypadku rozkładu t, gdzie wejściem do równania rozkładu t jest gamma, która wpływa na kształt krzywej rozkładu pomimo stałej średniej i stałego odchylenia standardowego.
źródło