Czy funkcja autokorelacji całkowicie opisuje proces stochastyczny?

31

Czy proces stochastyczny jest całkowicie opisany przez jego funkcję autokorelacji?

Jeśli nie, jakie dodatkowe właściwości byłyby potrzebne?

Andreas
źródło

Odpowiedzi:

44

Co oznacza pełny opis procesu stochastycznego? Cóż, matematycznie, proces stochastyczny to zbiór zmiennych losowych, po jednym dla każdej chwili w zestawie indeksów , gdzie zwykle jest całą rzeczywistą linią lub dodatnią rzeczywistą linią, a pełny opis oznacza, że ​​dla każdej liczby całkowitej i instancji czasowych , znamy rozkłady (wspólne) gdy zmiennymi losowymi , ,{X(t):tT}t TTn1nt1,t2,,tnTnX(t1)X(t2),X(tn). Jest to ogromna ilość informacji: musimy znać CDF dla dla każdej chwili , (dwuwymiarowy) połączony CDF dla i dla wszystkich wyborów momentu i , (trójwymiarowe) CDF , i itp. itd. itd.X(t)tX(t1)X(t2)t1t2X(t1)X(t2)X(t3)

Naturalnie ludzie szukali prostszych opisów i bardziej restrykcyjnych modeli. Jedno uproszczenie występuje, gdy proces jest niezmienny w stosunku do zmiany początku czasu. Oznacza to, że to

  • Wszystkie zmienne losowe w tym procesie mają identyczne CDF: dla wszystkich .FX(t1)(x)=FX(t2)(x)t1,t2
  • Wszelkie dwie zmienne losowe oddzielone przez określony czas mają ten sam wspólny CDF, jak każda inna para zmiennych losowych oddzielonych przez ten sam czas. Na przykład zmienne losowe i są oddzielone przez sekund, podobnie jak zmienne losowe i , a zatemX(t1)X(t1+τ)τX(t2)X(t2+τ)FX(t1),X(t1+τ)(x,y)=FX(t2),X(t2+τ)(x,y)
  • Każdy trzech zmiennych losowych , , rozmieszczone i siebie mają ten sam przegub, CDF jako , , które również jako odstępy między i ,X(t1)X(t1+τ1)X(t1+τ1+τ2)τ1τ2X(t2)X(t2+τ1)X(t2+τ1+τ2)τ1τ2
  • i tak dalej dla wszystkich wielowymiarowych CDF. Zobacz na przykład odpowiedź Petera K., aby poznać szczegóły wielowymiarowej sprawy.

W rzeczywistości probabilistyczne opisy losowego procesu nie zależą od tego, co nazwiemy początkiem na osi czasu: przesunięcie wszystkich instancji czasu o określoną stałą do daje ten sam probabilistyczny opis zmiennych losowych. Ta właściwość nazywana jest stacjonarną ścisłością, a proces losowy, który cieszy się tą właściwością, nazywany jest ściśle stacjonarnym procesem losowym lub, mówiąc prościej, stacjonarnym procesem losowym. t1,t2,,tnτt1+τ,t2+τ,,tn+τ

Należy pamiętać, że ścisła stacjonarność sama w sobie nie wymaga żadnej szczególnej formy CDF. Na przykład nie mówi, że wszystkie zmienne są gaussowskie.

Przymiotnik ściśle sugeruje, że można zdefiniować luźniejszą formę stacjonarności. Jeśli wspólny CDF dla jest taki sam jak wspólny CDF dla dla wszystkich wyborów i , wtedy mówi się, że losowy proces stacjonarny na zamówienie i jest określany jako -order stacjonarny losowy proces. Zauważ, że stacjonarny losowy proces jest również stacjonarny, aby uporządkować dla każdego wyniku dodatniegoNthX(t1),X(t2),,X(tN)NthX(t1+τ),X(t2+τ),,X(tN+τ)t1,t2,,tNτNNthNthnn<N . (Jest tak, ponieważ wspólny CDF z jest granicą CDF z ponieważ argumentów zbliża się : uogólnienie ). Ściśle stacjonarny sposób losowy jest zatem losowy sposób, że jest nieruchomy wszystkie klasy .nthNthNnFX(x)=limyFX,Y(x,y)N

Jeśli proces losowy jest stacjonarny w (co najmniej) rzędzie , wówczas wszystkie mają ten sam rozkład, a zatem, zakładając, że istnieje średnia, jest takie samo dla wszystkich . Podobnie jest takie samo dla wszystkich i jest określane jako moc procesu. Wszystkie procesy fizyczne mają skończoną moc, dlatego często przyjmuje się, że w którym to przypadku, a zwłaszcza w starszej literaturze inżynierskiej, proces ten nazywany jest procesem drugiego rzędu . Wybór nazwy jest niefortunny, ponieważ zachęca do pomyłek z drugim rzędem 1X(t)E[X(t)]=μtE[(X(t))2]tE[(X(t))2]<stacjonarność (por. ta moja odpowiedź na stats.SE ), więc tutaj wywołamy proces, dla którego jest skończone dla wszystkich (niezależnie od tego, czy jest stałą) jako proces o skończonej sile i unikaj tego zamieszania. Ale zauważ to jeszcze razE[(X(t))2]tE[(X(t))2]

proces stacjonarny pierwszego rzędu nie musi być procesem o skończonej mocy.

Rozważ losowy proces, który jest stacjonarny, aby zamówić . Ponieważ wspólny rozkład i jest taki sam, jak funkcja wspólnego rozkładu i , a wartość zależy tylko od . Oczekiwania te są skończone dla procesu o skończonej mocy, a ich wartość nazywa się funkcją autokorelacji procesu: jest funkcją , czasu rozdzielenie zmiennych losowych i i nie zależy od2X(t1)X(t1+τ)X(t2)X(t2+τ)E[X(t1)X(t1+τ)]=E[X(t2)X(t2+τ)]τRX(τ)=E[X(t)X(t+τ)]τX(t)X(t+τ)tw ogóle. Należy również zauważyć, że więc funkcja autokorelacji jest parzystą funkcją jej argumentu.

E[X(t)X(t+τ)]=E[X(t+τ)X(t)]=E[X(t+τ)X(t+ττ)]=RX(τ),

Stacjonarny losowy proces drugiego rzędu o skończonej mocy ma takie właściwości

  1. Jego średnia wartość jest stałaE[X(t)]
  2. Jego funkcja autokorelacji jest funkcją , separacji czasowej zmiennych losowych i , i nie wcale nie zależy od .RX(τ)=E[X(t)X(t+τ)]τX(t)X(t+τ)t

Założenie stacjonarności w pewnym stopniu upraszcza opis losowego procesu, ale dla inżynierów i statystów zainteresowanych budowaniem modeli na podstawie danych eksperymentalnych oszacowanie wszystkich tych CDF jest nietrudnym zadaniem, szczególnie gdy występuje tylko segment jednej ścieżki próbki (lub realizacja) na której można wykonać pomiary. Dwa pomiary, które są stosunkowo łatwe do wykonania (ponieważ inżynier ma już niezbędne narzędzia na swoim stole roboczym (lub programy w MATLAB / Python / Octave / C ++ w swojej bibliotece oprogramowania) to wartość DC z i funkcja autokorelacjix(t) 1T0Tx(t)dtx(t)Rx(τ)=1T0Tx(t)x(t+τ)dt(lub jego transformata Fouriera, widmo mocy ). Przyjmowanie tych pomiarów jako oszacowania średniej i funkcji autokorelacji procesu o skończonej mocy prowadzi do bardzo użytecznego modelu, który omówimy dalej.x(t)


Losowy proces o skończonej mocy nazywany jest procesem szerokokierunkowym (WSS) (również słabo stacjonarnym procesem losowym, który na szczęście ma również ten sam inicjalizm WSS), jeśli ma stałą średnią i jego funkcję autokorelacji zależy tylko od różnicy czasu (lub ).RX(t1,t2)=E[X(t1)X(t2)]t1t2t2t1

Zauważ, że definicja nic nie mówi o CDF zmiennych losowych wchodzących w skład procesu; jest to całkowicie ograniczenie momentów losowych zmiennych pierwszego i drugiego rzędu . Oczywiście stacjonarny proces losowy drugiego rzędu o skończonej mocy (lub - stacjonarny (dla ) lub ściśle stacjonarny) jest procesem WSS, ale odwrotność nie musi być prawdziwa.NthN>2

Proces WSS nie musi być stacjonarny dla żadnego zamówienia.

Rozważmy na przykład losowy proces gdzie przyjmuje cztery równie prawdopodobne wartości i . (Nie bój się: cztery możliwe ścieżki próbki tego losowego procesu to tylko cztery przebiegi sygnałowe sygnału QPSK). Zauważ, że każdy jest dyskretną losową zmienną, która ogólnie przyjmuje cztery równie prawdopodobne wartości i , łatwo zauważyć, że ogólnie i{X(t):X(t)=cos(t+Θ),<t<}Θ0,π/2,π3π/2X(t)cos(t),cos(t+π/2)=sin(t),cos(t+π)=cos(t)cos(t+3π/2)=sin(t)X(t)X(s)mają różne rozkłady, więc proces nie jest nawet stacjonarny pierwszego rzędu. Z drugiej strony dla każdego gdy Krótko mówiąc, proces ma średnią zero, a jego funkcja autokorelacji zależy tylko od różnicy czasu , więc proces jest szeroko zakrojony stacjonarnie. Ale to nie jest stacjonarne pierwszego rzędu, a więc nie może być stacjonarne dla wyższych zamówień.

E[X(t)]=14cos(t)+14(sin(t))+14(cos(t))+14sin(t)=0
t
E[X(t)X(s)]=14[cos(t)cos(s)+(cos(t))(cos(s))+sin(t)sin(s)+(sin(t))(sin(s))]=12[cos(t)cos(s)+sin(t)sin(s)]=12cos(ts).
ts

Nawet w przypadku procesów WSS, które stacjonarnymi (lub ściśle stacjonarnymi) procesami losowymi drugiego rzędu, niewiele można powiedzieć o konkretnych formach rozkładu zmiennych losowych. W skrócie,

Proces WSS niekoniecznie jest stacjonarny (w dowolnej kolejności), a średnia i funkcja autokorelacji procesu WSS nie wystarcza, aby dać pełny statystyczny opis procesu.

Wreszcie, przypuśćmy, że proces stochastyczny jest Zakłada się Gaussa proces ( „udowodnienia”, to z każdym rozsądnym stopniem pewności nie jest zadaniem trywialnym). Oznacza to, że dla każdego , jest losową zmienną Gaussa i dla wszystkich liczb całkowitych dodatnich i wyborów instancji czasowych , , , zmiennych losowych , , są łącznie losowymi zmiennymi Gaussa . Teraz wspólna funkcja gęstości Gaussa jest całkowicietX(t)n2nt1t2,tnNX(t1)X(t2),X(tn)określone za pomocą średnich, wariancji i kowariancji zmiennych losowych, aw tym przypadku znając funkcję średnią (nie musi być stałą, jak jest to wymagane dla szerokiego sensu -stationarity) i funkcja autokorelacji dla wszystkich (nie musi to zależeć tylko od jak jest to wymagane dla stacjonarności szerokopasmowej) wystarczy, aby całkowicie określić statystyki procesu.μX(t)=E[X(t)]RX(t1,t2)=E[X(t1)X(t2)]t1,t2t1t2

Jeśli proces gaussowski jest procesem WSS, to jest to również ściśle stacjonarny proces gaussowski. Na szczęście dla inżynierów i procesorów sygnałowych wiele procesów hałasu fizycznego może być dobrze modelowanych jako procesy gaussowskie WSS (a zatem procesy ściśle stacjonarne), dzięki czemu eksperymentalna obserwacja funkcji autokorelacji z łatwością zapewnia wszystkie wspólne rozkłady. Ponadto, ponieważ procesy gaussowskie zachowują swój charakter gaussowski podczas przechodzenia przez układ liniowy, a wyjściowa funkcja autokorelacji jest powiązana z funkcją wejściowej autokorelacji jako

Ry=hh~RX
tak, aby można było łatwo określić statystyki wyjściowe, proces WSS ogólnie, a zwłaszcza procesy gaussowskie WSS, mają ogromne znaczenie w zastosowaniach inżynierskich.

Dilip Sarwate
źródło
Czy mógłbyś w tym sensie skomentować „Biały szum”? Z definicji autokorelacja przy jest wariancją zmiennych losowych. Czy to znaczy, że AWGN (Additive White Gaussian Noise) ma nieskończoną wariancję? Zadaję to, ponieważ zwykle ludzie piszą , jest źle? Czy należy napisać ? Dzięki. τ=0n(t) N(0,N0/2)n(t) N(0,δ(0)N0/2)
Royi
1
@Drazick Zadaj osobne pytanie.
Dilip Sarwate
1
To fantastyczny mini-kurs z definicji procesów stacjonarnych. Nigdy czegoś takiego nie widziałem - ułożonego tak metodycznie i wyraźnie. Społeczność Wiki?
abalter
@Dilip Sarwate Przepraszam za moją ignorancję. W przykładzie Dlaczego E [X (t)] = 0 dla wszystkich t? Czy przyjąłeś ergodyczność? Jak wyprowadziłeś funkcję gęstości prawdopodobieństwa X (t) z funkcji gęstości prawdopodobieństwa theta, aby obliczyć wartość oczekiwaną? E [X (t) X (s)] = E [cos (t + theta) * cos (s + theta)] prawda? Jakie kroki podjąłeś, aby uprościć to wyrażenie i przejść do tego, co napisałeś? Dzięki
VMMF
1
@VMMF Jest NO ergodyczność używany. jest dyskretną zmienną losową, ponieważ jest dyskretną zmienną losową i przyjmuje wartości i z jednakowym prawdopodobieństwem . Ergo, . przyjmuje wartości , , and z jednakowym prawdopodobieństwem . Stąd,X(t)=cos(t+Θ)Θ±cos(t)±sin(t)14E[X(t)]=0X(t)X(s)cos(t)cos(s)(cos(t))(cos(s))=cos(t)cos(s)sin(t)sin(s)(sin(t))(sin(s))=sin(t)sin(s)14E[X(t)(X(s)]=12(cos(t)cos(s)+sin(t)sin(s))=12cos(ts)
.Dlatego