Różnica między wielowymiarowym standardowym rozkładem normalnym a kopulą Gaussa

17

Zastanawiam się, jaka jest różnica między wielowymiarowym rozkładem normalnym a kopulą Gaussa, ponieważ kiedy patrzę na funkcję gęstości, wydają mi się one takie same.

Moje pytanie dotyczy tego, dlaczego wprowadzono kopułę Gaussa lub jakie korzyści przynosi kopuła Gaussa lub jaka jest jej przewaga, gdy kopuła Gaussa jest niczym więcej niż samą wielowymiarową standardową funkcją normalną.

Jaka jest także koncepcja transformacji całki prawdopodobieństwa w kopule? To znaczy wiemy, że kopuła jest funkcją o zmiennej zmiennej jednolitej. Dlaczego musi być jednolity? Dlaczego nie wykorzystać rzeczywistych danych, takich jak wielowymiarowy rozkład normalny i znaleźć macierz korelacji? (Zwykle wykreślamy dwa zwroty z aktywów, aby wziąć pod uwagę ich relacje, ale gdy jest to kopula, wykreślamy Us, które są prawdopodobieństwami.)

Inne pytanie. Wątpię również, czy macierz korelacji z MVN mogłaby być nieparametryczna czy półparametryczna, jak kopula (dla parametru kopuły może być tau Kendalla itp.)

Byłbym bardzo wdzięczny za twoją pomoc, ponieważ jestem nowy w tej dziedzinie. (ale przeczytałem wiele artykułów i to jedyne rzeczy, których nie rozumiem)

użytkownik26979
źródło
Jak „patrzysz na funkcję gęstości”? Być może nie używasz wystarczająco czułej metody. Na przykład gęstość z pewnością nie jest wielowymiarowa normalna, gdy marginesy są nienormalne! Wypróbuj przy użyciu Gaussa kopułę z multimodalnego dystrybucji, takich jak beta : który powinien wyglądać zdecydowanie nie normalne! (1/2,1/2)
whuber
równanie (6) jest dwuwymiarową kopulą Gaussa CDF iopscience.iop.org/2041-8205/708/1/L9/fulltext/…, podczas gdy pierwsze równanie opisu jest dwuwymiarową normalną normalną CDF roguewave.com/portals/0/products/ imsl-numerical-libraries /… i kiedy porównamy je razem, forma funkcjonalna jest bardzo podobna. są dla mnie dokładnie takie same.
user26979,
Masz rację: dlatego nie powinieneś polegać na losowych odnośnikach do Internetu, szczególnie tych ze źle zdefiniowanymi terminami i okropnym składem. Skonsultuj się z Nelsonem (jednym ze źródeł pierwszego linku i doskonale czytelnym).
whuber
1
więc jeśli nie wspominając o powyższym, jaka jest różnica w twoim odczuciu?
user26979,

Odpowiedzi:

20

Jedną ogólną zasadą dotyczącą artykułów technicznych - zwłaszcza tych znalezionych w Internecie - jest to, że wiarygodność dowolnej oferowanej w nich definicji statystycznej lub matematycznej zmienia się odwrotnie w zależności od liczby niepowiązanych nie-statystycznych podmiotów wymienionych w tytule artykułu. Tytuł strony w pierwszej odsyłaczu (w komentarzu do pytania) brzmi „Od finansów do kosmologii: kopuła struktury wielkoskalowej”. Ponieważ zarówno „finanse”, jak i „kosmologia” pojawiają się w widocznym miejscu, możemy być całkiem pewni, że nie jest to dobre źródło informacji o kopulach!

Zamiast tego przejdźmy do standardowego i bardzo dostępnego podręcznika, Wprowadzenie Rogera Nelsena do copulas (wydanie drugie, 2006), dla kluczowych definicji.

... każda kopuła jest wspólną funkcją rozkładu z marginesami, które są jednolite dla [przedział jednostki zamkniętej .[0,1]]

[W p. 23, na dole.]

Aby uzyskać wgląd w kopuły, przejdź do pierwszego twierdzenia w książce, Twierdzenie Sklara :

Niech być wspólnym dystrybuanta marginesy F i G . Następnie istnieje kopuła C taka, że ​​dla wszystkich x , yHFGCx,y w [rozszerzonych liczbach rzeczywistych],

H(x,y)=C(F(x),G(y)).

[Podane na s. 18 i 21]

Chociaż Nelsen tak go nie nazywa, definiuje kopułę gaussowską w przykładzie:

... jeśli oznacza standardową (jednoczynnikową) funkcję rozkładu normalnego, a N ρ oznacza standardową dwuwymiarową funkcję rozkładu normalnego (ze współczynnikiem korelacji iloczynu Pearsona ρ ), to ... C ( u , v ) = 1ΦNρρ

C(u,v)=12π1ρ2Φ1(u)Φ1(v)exp[(s22ρst+t2)2(1ρ2)]dsdt

C(u,v)(Φ1(u),Φ1(v))FGCΦFGC

(Φ1(F(x)),Φ1(G(y)))FG


Przykład

F(4,2)XG(2)YHFGxy

Plot

0x10y

Brak symetrii powoduje, że jest to oczywiście nienormalne (i bez normalnych marginesów), ale mimo to ma konstrukcję kopuły Gaussa. FWIW ma formułę i jest brzydka, oczywiście też nie dwuwymiarowa Normalna:

132(20(1x)x3)(eyy)exp(w(x,y))

w(x,y)

erfc1(2(Q(2,0,y))223(2erfc1(2(Q(2,0,y)))erfc1(2(Ix(4,2)))2)2).

QIx

Whuber
źródło
Dzięki za edycję, @Cardinal: Wstydzę się błędnej pisowni imienia Nelsena, zwłaszcza gdy patrzyłem na niego z przodu książki! (W mojej obronie po raz pierwszy zauważyłem to w bibliografii dokumentu, do którego odnosi się OP, gdzie jest również błędnie napisane: to musiało się ze mną utknąć. :-)
whuber
To była taka drobna rzecz, pomyślałem, że po prostu wprowadzę zmiany. Pisownia jest niezwykła (przynajmniej po angielsku!), Szczególnie w porównaniu z bardziej powszechnym wariantem. :-)
kardynał