Mam problem z rozróżnieniem pojęć skrzeczności i stacjonarności. Jak rozumiem, heteroscedastyczność różni się zmiennością w subpopulacjach, a niestacjonarność jest zmieniającą się średnią / wariancją w czasie.
Jeśli jest to prawidłowe (choć uproszczone) zrozumienie, czy niestacjonarność jest po prostu konkretnym przypadkiem heteroscedastyczności w czasie?
time-series
heteroscedasticity
stationarity
intuition
TCAllen07
źródło
źródło
Odpowiedzi:
Aby podać dokładne definicje, niech będą zmiennymi losowymi o wartości rzeczywistej.X1, ... ,Xn
Stacjonarność jest zwykle definiowana tylko wtedy, gdy myślimy o indeksie zmiennych jako o czasie . W tym przypadku sekwencja zmiennych losowych jest stacjonarna z ma taki sam rozkład jak . Sugeruje to w szczególności, że dla wszystkie mają ten sam rozkład krańcowy, a zatem taką samą średnią krańcową i wariancję (biorąc pod uwagę, że mają skończony drugi moment).X1, ... ,Xn - 1 X2), ... ,Xn Xi i=1,…,n
Znaczenie heteroscedastyczności może zależeć od kontekstu. Jeżeli marginalne wariancje zmieniają się z (nawet jeśli średnia jest stała), zmienne losowe są nazywane heteroscedastycznymi w tym sensie, że nie są homoscedastyczne.Xi i
W analizie regresji zwykle rozważamy warunkowo odpowiedź na regresory i definiujemy heteroscedastyczność jako niestałą wariancję warunkową.
W analizie szeregów czasowych, gdzie terminologia warunkowego Heteroskedastyczność jest powszechne zainteresowanie jest zazwyczaj wariancji warunkowo na . Jeśli ta warunkowa wariancja nie jest stała, mamy warunkową heteroscedastyczność. Model ARCH (autoregresywna heteroscedastyczność warunkowa) jest najbardziej znanym przykładem stacjonarnego modelu szeregów czasowych o nie stałej stałej warunkowości.Xk Xk−1,…,X1
Heteroscedastyczność (w szczególności warunkowa heteroscedastyczność) zasadniczo nie oznacza niestacjonarności.
Stacjonarność jest ważna z wielu powodów. Jedną prostą konsekwencją statystyczną jest to, że średnia jest wówczas bezstronnym estymatorem oczekiwań (i przy założeniu ergodyczności , która jest nieco większa niż stacjonarność i często zakładana domyślnie, średnia jest spójnym estymatorem oczekiwań dla ).
Znaczenie heteroscedastyczności (lub homoscedastyczności) jest ze statystycznego punktu widzenia związane z oceną niepewności statystycznej, np. Obliczaniem przedziałów ufności. Jeśli obliczenia są przeprowadzane przy założeniu homoscedastyczności, podczas gdy dane faktycznie pokazują heteroscedastyczność, wynikające z tego przedziały ufności mogą być mylące.
źródło
Szereg czasowy jest nieruchomy, jeśli wszystkie jego właściwości statystyczne nie zależą od początku czasu. Jeśli to wymaganie nie jest spełnione, szeregi czasowe nie są nieruchome.
Nawet stacjonarnych szeregów czasowych nie można opisać na podstawie tylko jednego rekordu próbki. Jego właściwości statystyczne należy analizować przez uśrednienie zbioru rekordów próbek w różnych źródłach czasu.
Jeśli właściwości statystyczne są takie same dla każdego pojedynczego rekordu próbki i dla przypadku, gdy są one określane przez uśrednianie zestawu, szeregi czasowe są ergodyczne.
Ponieważ właściwości statystyczne heteroscedaktycznych szeregów czasowych są zależne od czasu, nie jest stacjonarne i, oczywiście, nie ergodyczne. Jego właściwości określone dla pojedynczego rekordu próbki nie mogą być rozszerzone na jego przeszłe i przyszłe zachowanie.
Nawiasem mówiąc, analizy korelacji / regresji nie można zastosować do szeregów czasowych, ponieważ zależność między nimi (funkcja koherencji) jest zależna od częstotliwości i można ją scharakteryzować za pomocą (wielowymiarowych) równań stochastycznych równań (dziedzina czasu) lub funkcji odpowiedzi częstotliwościowej (dziedzina częstotliwości).
Rozszerzenie analizy regresji opracowanej dla zmiennych losowych na szeregi czasowe jest błędne (np. Patrz Bendat i Piersol, 2010; Box i in., 2015).
źródło
Istnieją 3 stopnie stacjonarne. Słaba forma wymaga średniej, a wariancja jest utrzymywana na stałym poziomie. Oznacza to, że z 3 definicji stacjonarnych są wyższe wymagania niż heteroscedastyczność, ponieważ heteroscedastyczność oznacza stałą wariancję, bez odniesienia do średniej.
Proces może mieć heteroscedastyczność. Ale jeśli jego średnia nie jest stała, wówczas proces nie jest (słabo) stacjonarny.
Proces stacjonarny (oznaczmy to jako „S”) implikuje homoscedastyczność (oznaczmy to jako „H”). Więc S -> H.
Oczywiście jego przeciwieństwo jest również prawdziwe . Zatem H '-> S', tj. Niehomosymastastyczność implikuje niestacjonarność.
Ale inwersja i negacja nie są prawdziwe . Innymi słowy:
„Niestacjonarne implikuje nie homoscedastyczność” nie jest prawdą.
„Istnieje proces stacjonarny, który nie jest homoscedastycznością” nie jest prawdą.
źródło