Rozkład maksymalnie dwóch skorelowanych zmiennych normalnych

Odpowiedzi:

22

Według Nadarajah i Kotza, 2008 , Dokładny rozkład maksymalnej / minimalnej dwóch zmiennych losowych Gaussa wydaje się , że plik PDFX=max(X1,X2)

f(x)=2ϕ(x)Φ(1r1r2x),

gdzie to PDF, a to CDF standardowego rozkładu normalnego.ΦϕΦ

wprowadź opis zdjęcia tutaj

Lucas
źródło
Jak to wygląda, jeśli (brak korelacji)? Mam problem z wizualizacją tego. r=0
Mitch,
3
Dodałem rysunek przedstawiający rozkład. Wygląda jak ściśnięty gaussowski lekko pochylony w prawo.
Lucas,
22

Niech będzie dwuwymiarowym normalnym plikiem PDF dla ze standardowymi marginesami i korelacją . CDF maksimum jest z definicji ( X , Y ) ρfρ(X,Y)ρ

Pr(max(X,Y)z)=Pr(Xz, Yz)=zzfρ(x,y)dydx.

Dwuwymiarowy normalny PDF jest symetryczny (poprzez odbicie) wokół przekątnej. Zatem zwiększenie od do dodaje dwa paski o równoważnym prawdopodobieństwie do pierwotnego kwadratu częściowo nieskończonego: nieskończenie gruby górny kwadrat to podczas gdy jego odzwierciedlonym odpowiednikiem jest pasek po prawej stronie to .z + d z ( - , z ] × ( z , z + d z ] ( z , z + d z ] × ( - , z ]zz+dz(,z]×(z,z+dz](z,z+dz]×(,z]

Postać

Gęstość prawdopodobieństwa prawego paska to gęstość w całkowitego prawdopodobieństwa warunkowego, że jest w pasku, . Rozkład warunkowy jest zawsze Normalny, więc aby znaleźć to całkowite prawdopodobieństwo warunkowe, potrzebujemy tylko średniej i wariancji. Średnia warunkowa w jest prognozą regresji a wariancja warunkowa jest "niewyjaśnioną" wariancją .z Y Pr ( Y zXzYY Y X ρ X var ( Y ) - var ( ρ X ) = 1 - ρ 2Pr(Yz|X=z)YYXρXvar(Y)var(ρX)=1ρ2

Teraz, gdy wiemy warunkowego średniej i wariancji, warunkowego CDF danego można uzyskać poprzez standaryzację i stosując standardowy Normalny CDF :YXYΦ

Pr(Yy|X)=Φ(yρX1ρ2).

Oszacowanie tego przy i oraz pomnożenie przez gęstość przy (standardowy Normalny pdf ) daje gęstość prawdopodobieństwa drugiego (prawego) paskay=zX=zXzϕ

ϕ(z)Φ(z-ρz1-ρ2))=ϕ(z)Φ(1-ρ1-ρ2)z).

Podwojenie tego odpowiada górnemu paskowi, który jest prawdopodobny, dając PDF maksimum jako

rerezPr(max(X,Y)z)=2)ϕ(z)Φ(1-ρ1-ρ2)z).

Podsumowanie

Pokolorowałem czynniki, aby zaznaczyć ich pochodzenie: dla dwóch symetrycznych pasków; dla nieskończenie małych szerokości paska; i dla długości pasków. Argument tego ostatniego, , jest po prostu standardową wersją uwarunkowaną .ϕ ( z ) Φ ( ) 1 - ρ2)ϕ(z)Φ()Y=zX=z1-ρ1-ρ2)zY=zX=z

Whuber
źródło
Czy można to rozszerzyć na więcej niż dwie standardowe zmienne normalne przy danej macierzy korelacji?
A. Donda
1
@ A.Donda Tak - ale wyrażenie staje się bardziej skomplikowane. Z każdym nowym wymiarem pojawia się potrzeba ponownej integracji.
whuber