Czy korelacja zakłada stacjonarność danych?

27

Analiza międzyrynkowa jest metodą modelowania zachowań rynkowych poprzez znajdowanie relacji między różnymi rynkami. Często oblicza się korelację między dwoma rynkami, powiedzmy S&P 500 i 30-letnimi amerykańskimi skarbami. Obliczenia te najczęściej oparte są na danych cenowych, co jest oczywiste dla wszystkich, że nie pasuje do definicji stacjonarnych szeregów czasowych.

Pomijając możliwe rozwiązania (zamiast tego wykorzystujemy zwroty), czy obliczenie korelacji, której dane są niestacjonarne, jest nawet poprawnym obliczeniem statystycznym?

Czy powiedziałbyś, że takie obliczenie korelacji jest nieco niewiarygodne, czy po prostu nonsens?

Milktrader
źródło
1
co rozumiesz przez „prawidłowe obliczenie statystyczne”, powinieneś powiedzieć prawidłowe wyliczenie statystyczne (oszacowanie) czegoś. Tutaj coś jest bardzo ważne. Korelacja to prawidłowe obliczenie liniowej zależności między dwoma zestawami danych. Nie rozumiem, dlaczego potrzebujesz stacjonarności, miałeś na myśli autokorelację?
robin girard
2
jest nowa strona, która może być bardziej odpowiednia dla twojego pytania: quant.stackexchange.com . Teraz wyraźnie mylisz obliczenia z interpretacją.
mpiktas
@mpiktas, społeczność kwantowa jest rozliczana na podstawie zwrotów w stosunku do cen z powodu stacjonarności zwrotów i niestacjonarności cen. Proszę tutaj o coś więcej niż intuicyjne wyjaśnienie, dlaczego tak powinno być.
Milktrader,
@robin, istnieje kilka rzeczy, które mogą powodować kwestionowanie analizy statystycznej. Przychodzi mi na myśl wielkość próbki, podobnie jak bardziej oczywiste rzeczy, takie jak zmanipulowane dane. Czy niestacjonarność danych podważa obliczenia korelacji?
Milktrader
nie obliczenia, może interpretacja, jeśli korelacja nie jest wysoka. Jeśli jest wysoki, oznacza to wysoką korelację (tj. Wysoką relację liniową), dwa niestacjonarne szeregi czasowe mówią i mogą być potencjalnie silnie skorelowane (na przykład, gdy .(Xt)(Yt)Xt=Yt
robin girard

Odpowiedzi:

37

Korelacja mierzy zależność liniową. W kontekście nieformalnym związek oznacza coś stabilnego. Kiedy obliczamy korelację próbki dla zmiennych stacjonarnych i zwiększamy liczbę dostępnych punktów danych, ta korelacja próbki dąży do prawdziwej korelacji.

Można wykazać, że w przypadku cen, które zwykle są spacerami losowymi, korelacja próbki dąży do zmiennej losowej. Oznacza to, że bez względu na to, ile danych mamy, wynik zawsze będzie inny.

Uwaga Próbowałem wyrazić intuicję matematyczną bez matematyki. Z matematycznego punktu widzenia wyjaśnienie jest bardzo jasne: przykładowe momenty procesów stacjonarnych zbiegają się w prawdopodobieństwie ze stałymi. Przykładowe momenty losowych spacerów są zbieżne z całkami ruchu Browna, które są zmiennymi losowymi. Ponieważ związek jest zwykle wyrażany jako liczba, a nie zmienna losowa, staje się oczywisty powód nie obliczania korelacji dla zmiennych niestacjonarnych.

Aktualizacja Ponieważ jesteśmy zainteresowani korelacją między dwiema zmiennymi, najpierw załóżmy, że pochodzą one z procesu stacjonarnego . Stacjonarność oznacza, że i nie zależą od . Więc korelacjaE Z t c o v ( Z t , Z t - h ) tZt=(Xt,Yt)EZtcov(Zt,Zth)t

corr(Xt,Yt)=cov(Xt,Yt)DXtDYt

również nie zależy od , ponieważ wszystkie wielkości we wzorze pochodzą z macierzy , która nie zależy od . Tak więc obliczenie korelacji próbkic o v ( Z t ) ttcov(Zt)t

ρ=CORR(X, T,Yt)ρρT

ρ^=1Tt=1T(XtX¯)(YtY¯)1T2t=1T(XtX¯)2t=1T(YtY¯)2
ma sens, ponieważ możemy mieć uzasadnioną nadzieję, że korelacja próbki oszacuje . Okazuje się, że ta nadzieja nie jest bezpodstawna, ponieważ dla stacjonarnych procesów spełniających określone warunki, które mamy , jak prawdopodobieństwa. Ponadto w dystrybucji, dzięki czemu możemy przetestować hipotezy dotyczące .ρ=corr(Xt,Yt)ρ^ρTρT(ρ^ρ)N(0,σρ2)ρ

Załóżmy teraz, że nie jest stacjonarny. Zatem może zależeć od . Więc kiedy obserwujemy próbkę wielkości , potencjalnie musimy oszacować różne korelacje . Jest to oczywiście niemożliwe, dlatego w najlepszym przypadku możemy oszacować tylko niektóre funkcje takie jak średnia lub wariancja. Ale wynik może nie mieć sensownej interpretacji. c o r r ( X t , Y t ) t T T ρ t ρ tZtcorr(Xt,Yt)tTTρtρt

Przyjrzyjmy się teraz, co dzieje się z korelacją prawdopodobnie najbardziej zbadanego losowego spaceru niestacjonarnego procesu. Proces chodzeniem losowym, jeśli , gdzie jest procesem stacjonarnym. Dla uproszczenia załóżmy, że . NastępnieZ t = t s = 1 ( U t , V t ) C t = ( U t , V t ) E C t = 0Zt=(Xt,Yt)Zt=s=1t(Ut,Vt)Ct=(Ut,Vt)ECt=0

corr(XtYt)=EXtYtDXtDYt=Es=1tUts=1tVtDs=1tUtDs=1tVt

Aby jeszcze bardziej uprościć sprawę, załóżmy, że jest białym szumem. Oznacza to, że wszystkie korelacje są zerowe dla . Zauważ, że nie ogranicza to do zera.E ( C t C t + h ) h > 0 c o r r ( U t , V t )Ct=(Ut,Vt)E(CtCt+h)h>0corr(Ut,Vt)

Następnie

corr(Xt,Yt)=tEUtVtt2DUtDVt=corr(U0,V0).

Jak dotąd dobrze, choć proces nie jest stacjonarny, korelacja ma sens, chociaż musieliśmy przyjąć takie same restrykcyjne założenia.

Teraz, aby zobaczyć, co dzieje się z przykładową korelacją, będziemy musieli wykorzystać następujący fakt dotyczący losowych spacerów, zwany funkcjonalnym twierdzeniem o centralnym limicie:

y[0,1],W,S=(W1S,W2s)Ms=(M1s,M2s)=(

1TZ[Ts]=1Tt=1[Ts]Ct(cov(C0))1/2Ws,
w rozkładzie, gdzie i jest dwuwymiarowy Ruch Browna (dwuwymiarowy proces Wienera). Dla wygody definicję .s[0,1]Ws=(W1s,W2s)Ms=(M1s,M2s)=(cov(C0))1/2Ws

Ponownie dla uproszczenia zdefiniujmy próbkę korelacji jako

ρ^=1Tt=1TXtYt1Tt=1TXt21Tt=1TYt2

Zacznijmy od wariancji. Mamy

E1Tt=1TXt2=1TEt=1T(s=1tUt)2=1Tt=1TtσU2=σUT+12.

Zwiększa się to do nieskończoności wraz ze wzrostem , więc trafiamy na pierwszy problem, wariancja próbki nie jest zbieżna. Z drugiej strony daje nam twierdzenie o ciągłym odwzorowaniu w połączeniu z funkcjonalnym twierdzeniem o granicy centralnejT

T

1T2t=1TXt2=t=1T1T(1Ts=1tUt)201M1s2ds
gdzie zbieżność jest zbieżnością w dystrybucji, podobnie jak .T

Podobnie otrzymujemy

1

1T2t=1TYt201M2s2ds
i
1T2t=1TXtYt01M1sM2sds

W końcu dla próbki korelacji naszego losowego marszu otrzymujemy

ρ^01M1sM2sds01M1s2ds01M2s2ds
w dystrybucji jako . T

Zatem chociaż korelacja jest dobrze zdefiniowana, korelacja próbki nie jest do niej zbieżna, jak w przypadku procesu stacjonarnego. Zamiast tego zbiega się do pewnej zmiennej losowej.

mpiktas
źródło
1
Matematyczne wyjaśnienie punktu widzenia było tym, czego szukałem. Daje mi to coś do kontemplowania i odkrywania. Dzięki.
Milktrader
1
Ta odpowiedź wydaje się pomijać pierwotne pytanie: czy nie mówisz tylko, że tak, obliczanie korelacji ma sens w przypadku procesów stacjonarnych?
whuber
1
@ Whuber odpowiadałem na pytanie, mając na uwadze komentarz, ale przeczytałem je ponownie i, o ile rozumiem, OP prosi o obliczenie korelacji dla danych niestacjonarnych. Obliczanie korelacji dla procesów stacjonarnych ma sens, na tym opiera się cała analiza makroekonometryczna (VAR, VECM).
mpiktas
Spróbuję wyjaśnić moje pytanie, udzielając odpowiedzi.
whuber
3
@ Whuber mój odejście od odpowiedzi jest taki, że korelacja oparta na niestacjonarnych danych daje losową zmienną, która może, ale nie musi, być użyteczna. Korelacja oparta na danych stacjonarnych jest zbieżna do stałej. To może wyjaśniać, dlaczego inwestorzy są zainteresowani „korelacją kroczącą w ciągu dnia”, ponieważ skorelowane zachowanie jest ulotne i fałszywe. To, czy „ruchoma korelacja x-dniowa” jest ważna czy użyteczna, ma inne pytanie.
Milktrader
13

... czy obliczenie korelacji, której dane są niestacjonarne, jest nawet ważnym obliczeniem statystycznym?

Niech będzie dyskretnym przypadkowym spacerem. Wybierz liczbę dodatnią . Zdefiniuj procesy i pomocą , jeśli , a w innym przypadku ; i . Innymi słowy, zaczyna się identycznie jak ale za każdym razem, gdy wzrasta powyżej , zmienia znaki (w przeciwnym razie emuluje pod każdym względem).h P V P ( 0 ) = 1 P ( t + 1 ) = - P ( t ) V ( t ) > h P ( t + 1 ) = P ( t ) V ( t ) = P ( t ) W ( t ) V W V h WWhPVP(0)=1P(t+1)=P(t)V(t)>hP(t+1)=P(t)V(t)=P(t)W(t)VWVhW

wprowadź opis zdjęcia tutaj

(Na tym rysunku (dla ) jest niebieskie, a jest czerwone. Na znaku są cztery przełączniki.)W V.h=5WV

W efekcie, w krótkich okresach czasu ma tendencję do idealnej korelacji z lub do perfekcji z nim skorelowanej ; jednak użycie funkcji korelacji do opisania związku między i nie byłoby przydatne (słowo, które być może bardziej trafnie oddaje problem, niż „niewiarygodne” lub „bzdury”).W V WVWVW

Kod matematyczny do utworzenia liczby:

With[{h=5},
pv[{p_, v_}, w_] := With[{q=If[v > h, -p, p]}, {q, q w}];
w = Accumulate[RandomInteger[{-1,1}, 25 h^2]];
{p,v} = FoldList[pv, {1,0}, w] // Transpose;
ListPlot[{w,v}, Joined->True]]
Whuber
źródło
dobrze, że twoja odpowiedź na to wskazuje, ale nie powiedziałbym, że proces jest skorelowany, powiedziałbym, że są zależne. O to chodzi. Obliczanie korelacji jest wartościowe i tutaj powie „brak korelacji” i wszyscy wiemy, że nie oznacza to „braku zależności”.
robin girard
1
@robin To dobra uwaga, ale skonstruowałem ten przykład specjalnie, aby przez potencjalnie długi czas te dwa procesy były doskonale skorelowane. Problemem nie jest zależność od korelacji, ale nieodłącznie wiąże się z subtelniejszym zjawiskiem: zależność między procesami zmienia się w przypadkowych okresach. To w skrócie to, co może się zdarzyć na prawdziwych rynkach (a przynajmniej powinniśmy się martwić, że tak się stanie!).
whuber
@ whubert tak, a to bardzo dobry przykład pokazujący, że istnieją procesy, które mają bardzo wysoką korelację przez potencjalnie długie okresy czasu i nadal nie są w ogóle skorelowane (ale wysoce zależne), jeśli chodzi o większą skalę czasową.
robin girard
2
@robin girin, myślę, że kluczem tutaj jest to, że dla procesów niestacjonarnych korelacja teoretyczna zmienia się w czasie, gdy dla procesów stacjonarnych korelacja teoretyczna pozostaje taka sama. Zatem przy korelacji próbek, która zasadniczo jest jedną liczbą, niemożliwe jest uchwycenie zmienności prawdziwych korelacji w przypadku procesów niestacjonarnych.
mpiktas