Analiza międzyrynkowa jest metodą modelowania zachowań rynkowych poprzez znajdowanie relacji między różnymi rynkami. Często oblicza się korelację między dwoma rynkami, powiedzmy S&P 500 i 30-letnimi amerykańskimi skarbami. Obliczenia te najczęściej oparte są na danych cenowych, co jest oczywiste dla wszystkich, że nie pasuje do definicji stacjonarnych szeregów czasowych.
Pomijając możliwe rozwiązania (zamiast tego wykorzystujemy zwroty), czy obliczenie korelacji, której dane są niestacjonarne, jest nawet poprawnym obliczeniem statystycznym?
Czy powiedziałbyś, że takie obliczenie korelacji jest nieco niewiarygodne, czy po prostu nonsens?
correlation
stationarity
Milktrader
źródło
źródło
Odpowiedzi:
Korelacja mierzy zależność liniową. W kontekście nieformalnym związek oznacza coś stabilnego. Kiedy obliczamy korelację próbki dla zmiennych stacjonarnych i zwiększamy liczbę dostępnych punktów danych, ta korelacja próbki dąży do prawdziwej korelacji.
Można wykazać, że w przypadku cen, które zwykle są spacerami losowymi, korelacja próbki dąży do zmiennej losowej. Oznacza to, że bez względu na to, ile danych mamy, wynik zawsze będzie inny.
Uwaga Próbowałem wyrazić intuicję matematyczną bez matematyki. Z matematycznego punktu widzenia wyjaśnienie jest bardzo jasne: przykładowe momenty procesów stacjonarnych zbiegają się w prawdopodobieństwie ze stałymi. Przykładowe momenty losowych spacerów są zbieżne z całkami ruchu Browna, które są zmiennymi losowymi. Ponieważ związek jest zwykle wyrażany jako liczba, a nie zmienna losowa, staje się oczywisty powód nie obliczania korelacji dla zmiennych niestacjonarnych.
Aktualizacja Ponieważ jesteśmy zainteresowani korelacją między dwiema zmiennymi, najpierw załóżmy, że pochodzą one z procesu stacjonarnego . Stacjonarność oznacza, że i nie zależą od . Więc korelacjaE Z t c o v ( Z t , Z t - h ) tZt=(Xt,Yt) EZt cov(Zt,Zt−h) t
również nie zależy od , ponieważ wszystkie wielkości we wzorze pochodzą z macierzy , która nie zależy od . Tak więc obliczenie korelacji próbkic o v ( Z t ) tt cov(Zt) t
ρ=CORR(X, T,Yt)ρ→ρT→∞√
Załóżmy teraz, że nie jest stacjonarny. Zatem może zależeć od . Więc kiedy obserwujemy próbkę wielkości , potencjalnie musimy oszacować różne korelacje . Jest to oczywiście niemożliwe, dlatego w najlepszym przypadku możemy oszacować tylko niektóre funkcje takie jak średnia lub wariancja. Ale wynik może nie mieć sensownej interpretacji. c o r r ( X t , Y t ) t T T ρ t ρ tZt corr(Xt,Yt) t T T ρt ρt
Przyjrzyjmy się teraz, co dzieje się z korelacją prawdopodobnie najbardziej zbadanego losowego spaceru niestacjonarnego procesu. Proces chodzeniem losowym, jeśli , gdzie jest procesem stacjonarnym. Dla uproszczenia załóżmy, że . NastępnieZ t = ∑ t s = 1 ( U t , V t ) C t = ( U t , V t ) E C t = 0Zt=(Xt,Yt) Zt=∑ts=1(Ut,Vt) Ct=(Ut,Vt) ECt=0
Aby jeszcze bardziej uprościć sprawę, załóżmy, że jest białym szumem. Oznacza to, że wszystkie korelacje są zerowe dla . Zauważ, że nie ogranicza to do zera.E ( C t C t + h ) h > 0 c o r r ( U t , V t )Ct=(Ut,Vt) E(CtCt+h) h>0 corr(Ut,Vt)
Następnie
Jak dotąd dobrze, choć proces nie jest stacjonarny, korelacja ma sens, chociaż musieliśmy przyjąć takie same restrykcyjne założenia.
Teraz, aby zobaczyć, co dzieje się z przykładową korelacją, będziemy musieli wykorzystać następujący fakt dotyczący losowych spacerów, zwany funkcjonalnym twierdzeniem o centralnym limicie:
y∈[0,1],W,S=(W1S,W2s)Ms=(M1s,M2s)=(
Ponownie dla uproszczenia zdefiniujmy próbkę korelacji jako
Zacznijmy od wariancji. Mamy
Zwiększa się to do nieskończoności wraz ze wzrostem , więc trafiamy na pierwszy problem, wariancja próbki nie jest zbieżna. Z drugiej strony daje nam twierdzenie o ciągłym odwzorowaniu w połączeniu z funkcjonalnym twierdzeniem o granicy centralnejT
T→∞
Podobnie otrzymujemy
1
W końcu dla próbki korelacji naszego losowego marszu otrzymujemy
Zatem chociaż korelacja jest dobrze zdefiniowana, korelacja próbki nie jest do niej zbieżna, jak w przypadku procesu stacjonarnego. Zamiast tego zbiega się do pewnej zmiennej losowej.
źródło
Niech będzie dyskretnym przypadkowym spacerem. Wybierz liczbę dodatnią . Zdefiniuj procesy i pomocą , jeśli , a w innym przypadku ; i . Innymi słowy, zaczyna się identycznie jak ale za każdym razem, gdy wzrasta powyżej , zmienia znaki (w przeciwnym razie emuluje pod każdym względem).h P V P ( 0 ) = 1 P ( t + 1 ) = - P ( t ) V ( t ) > h P ( t + 1 ) = P ( t ) V ( t ) = P ( t ) W ( t ) V W V h WW h P V P(0)=1 P(t+1)=−P(t) V(t)>h P(t+1)=P(t) V(t)=P(t)W(t) V W V h W
(Na tym rysunku (dla ) jest niebieskie, a jest czerwone. Na znaku są cztery przełączniki.)W V.h=5 W V
W efekcie, w krótkich okresach czasu ma tendencję do idealnej korelacji z lub do perfekcji z nim skorelowanej ; jednak użycie funkcji korelacji do opisania związku między i nie byłoby przydatne (słowo, które być może bardziej trafnie oddaje problem, niż „niewiarygodne” lub „bzdury”).W V WV W V W
Kod matematyczny do utworzenia liczby:
źródło