Szacowanie losowego marszu z AR (1)

Kiedy oceniam losowy spacer z AR (1), współczynnik jest bardzo bliski 1, ale zawsze mniejszy.

Jaki jest powód matematyczny, że współczynnik nie jest większy niż jeden?

regression autoregressive random-walk Marco
źródło

Próbowałem z przybornikiem Matlab, a także ze skryptem na arima (gdzie współczynnik jest ograniczony do [-10,10], a wynik jest taki sam). Próbuję z prostym OLS i wynik jest taki sam.

Marco

Szacunki są tendencyjne w dół, musimy przeczytać artykuł Dickeya i Fullera.

Marco

Odpowiedzi:

Szacujemy według OLS model

x_{t} = ρ x_{t - 1} + u_{t}, mi (u_{t} ∣ {x_{t - 1}, x_{t - 2)}, . . .}) = 0, x_{0} = 0

$x_{t} = \rho x_{t-1} + u_t,\;\; E(u_t \mid \{x_{t-1}, x_{t-2},...\}) =0,\;x_0 =0$

Dla próbki o rozmiarze T estymatorem jest

\hat{ρ} = \frac{\sum_{t = 1}^{T.} x_{t} x_{t - 1}}{\sum_{t = 1}^{T.} x_{t - 1}^{2)}} = ρ + \frac{\sum_{t = 1}^{T.} u_{t} x_{t - 1}}{\sum_{t = 1}^{T.} x_{t - 1}^{2)}}

$\hat \rho = \frac {\sum_{t=1}^T x_{t}x_{t-1}}{\sum_{t=1}^T x_{t-1}^2} = \rho + \frac {\sum_{t=1}^T u_tx_{t-1}}{\sum_{t=1}^T x_{t-1}^2}$

Jeśli prawdziwym mechanizmem generowania danych jest czysty losowy spacer, to i $\rho=1$

x_{t} = x_{t - 1} + u_{t} ⟹ x_{t} = \sum_{ja = 1}^{t} u_{ja}

$x_{t} = x_{t-1} + u_t \implies x_t= \sum_{i=1}^t u_i$

Rozkład próbek estymatora OLS lub równoważnie, rozkład próbkowania , nie jest symetryczny wokół zera, ale raczej jest pochylone w lewo, od zera, przy % uzyskanych wartości (np masy prawdopodobieństwa) jest ujemna, a więc otrzymujemy nie częściej niż . Oto względny rozkład częstotliwości $\hat \rho - 1$ $\approx 68$ $\approx$ $\hat \rho < 1$

wprowadź opis zdjęcia tutaj

\begin{aligned} Oznaczać: - 0,0017773 \\ Mediana: - 0,00085984 \\ Minimum: - 0,042875 \\ Maksymalny: 0,0052173 \\ Odchylenie standardowe: 0,0031625 \\ Skośność: - 2,2568 \\ Dawny. kurtoza: 8,3017 \end{aligned}

$\begin{align} \text{Mean:} -0.0017773\\ \text{Median:} -0.00085984\\ \text{Minimum: } -0.042875\\ \text{Maximum: } 0.0052173\\ \text{Standard deviation: } 0.0031625\\ \text{Skewness: } -2.2568\\ \text{Ex. kurtosis: } 8.3017\\ \end{align}$

Jest to czasami nazywane rozkładem „Dickeya-Fullera”, ponieważ stanowi podstawę wartości krytycznych używanych do wykonywania testów root-root o tej samej nazwie.

Nie przypominam sobie, że dostrzegłem próbę zapewnienia intuicji dla kształtu rozkładu próbkowania. Patrzymy na rozkład próbkowania zmiennej losowej

\hat{ρ} - 1 = (\sum_{t = 1}^{T.} u_{t} x_{t - 1}) \cdot (\frac{1}{\sum_{t = 1}^{T.} x_{t - 1}^{2)}})

$\hat \rho - 1 = \left(\sum_{t=1}^T u_tx_{t-1}\right)\cdot \left(\frac {1}{\sum_{t=1}^T x_{t-1}^2}\right)$

$u_t$ $\hat \rho - 1$ $\hat \rho - 1$

$T=5$

Jeśli zsumujemy niezależne Normy Produktu, otrzymamy rozkład, który pozostaje symetryczny wokół zera. Na przykład:

wprowadź opis zdjęcia tutaj

Ale jeśli zsumujemy niezależne Normy Produktu, tak jak w naszym przypadku, otrzymamy

wprowadź opis zdjęcia tutaj

który jest przekrzywiony w prawo, ale z większą masą prawdopodobieństwa przypisaną wartościom ujemnym. A masa wydaje się być przesuwana jeszcze bardziej w lewo, jeśli zwiększymy wielkość próbki i dodamy więcej skorelowanych elementów do sumy.

Odwrotność sumy nie-niezależnych gamma jest nieujemną zmienną losową z dodatnim przekrzywieniem.

$\hat \rho -1$

Alecos Papadopoulos
źródło

Wow, niezła analiza! Czy możesz wskazać, które ze standardowych założeń OLS jest tutaj naruszane?

Richard Hardy

@RichardHardy Thanks. Wrócę później, aby odpowiedzieć na twój komentarz.

Alecos Papadopoulos

Nadal jestem ciekawa założeń OLS ... Z góry dziękuję!

Richard Hardy

Jestem trochę zdezorientowany. W przypadku losowego marszu próbujemy oszacować równanie

X_{t + 1} = α X_{t} + ϵ

$X_{t+1} = \alpha X_t + \epsilon$ , ze względu na współdziałający realtionsip

X_{t + 1} - X_{t}

$X_{t+1} - X_t$ powinniśmy zbiegać się w superkonsekwentnym tempie. Czy twoja symulacja również wskazuje na niespójność?

Cagdas Ozgenc

@CagdasOzgenc Nie ma czegoś takiego. Cosistency jest cechą asymptotyczną, poniżej przedstawiam, dlaczego w próbkach skończonych powinniśmy uzyskiwać

\hat{ρ} < 1

$\hat \rho<1$ „częściej niż nie” (ze względu na rozkład estymatora

\hat{ρ} - 1

$\hat \rho-1$ ma większą masę prawdopodobieństwa w liczbach ujemnych).

Alecos Papadopoulos

To naprawdę nie jest odpowiedź, ale za długa na komentarz, więc i tak to zamieszczam.

Byłem w stanie uzyskać współczynnik większy niż 1 dwa razy na sto dla próbki o wielkości 100 (używając „R”):

N=100                   # number of trials
T=100                   # length of time series
coef=c()
for(i in 1:N){
 set.seed(i)
 x=rnorm(T)             # generate T realizations of a standard normal variable
 y=cumsum(x)            # cumulative sum of x produces a random walk y
 lm1=lm(y[-1]~y[-T])    # regress y on its own first lag, with intercept
 coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1

Realizacje 84 i 95 mają współczynnik powyżej 1, więc nie zawsze jest poniżej jednego. Jednak wyraźnie widać tendencję do tendencyjnych spadków. Pozostaje pytanie, dlaczego ?

Edycja: powyższe regresje zawierały pojęcie przechwytywania, które wydaje się nie należeć do modelu. Po usunięciu przechwytywania otrzymuję o wiele więcej danych szacunkowych powyżej 1 (3158 na 10000) - ale nadal jest wyraźnie poniżej 50% wszystkich przypadków:

N=10000                 # number of trials
T=100                   # length of time series
coef=c()
for(i in 1:N){
 set.seed(i)
 x=rnorm(T)             # generate T realizations of a standard normal variable
 y=cumsum(x)            # cumulative sum of x produces a random walk y
 lm1=lm(y[-1]~-1+y[-T]) # regress y on its own first lag, without intercept
 coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1

Richard Hardy
źródło

dokładnie nie zawsze „niewielkie”, ale w większości przypadków. To oczywiście fałszywy wynik. dlaczego powód

Marco

Współczynnik jest szacowany przez OLS prawie jako korelacja między

x_{t}

$x_t$ i

x_{t - 1}

$x_{t-1}$ , co może wyjaśniać dlaczego.

Xi'an