Jakie jest normalne przybliżenie rozkładu wielomianowego?

Odpowiedzi:

21

Można to przybliżyć za pomocą wielowymiarowego rozkładu normalnego w taki sam sposób, w jaki rozkład dwumianowy jest aproksymowany przez jednowymiarowy rozkład normalny. Sprawdź elementy teorii dystrybucji i dystrybucji wielomianowej strony 15-16-17.

Niech będzie wektorem prawdopodobieństw. Zatem średni wektor wielowymiarowego rozkładu normalnego wynosi . Macierz kowariancji jest macierzą symetryczną . Elementy diagonalne są w rzeczywistości wariancją ; tj. , . Element nie przekątny w i-tym wierszu i j-tej kolumnie to , gdzie nie jest równe .n P = ( N s 1 , n p 2 , . . . , N p k ) k x k x i n s I ( 1 - P i ) i = 1 , 2 ... , k Cov ( X i , X jP=(p1,...,pk)np=(np1,np2,...,npk)k×kXinpi(1pi)i=1,2...,k i jCov(Xi,Xj)=npipjij

Stat
źródło
1
Sprawdź 2. referencję.
Stat
3
Stat, aby ta odpowiedź była samodzielna (i odporna na zgniliznę linków), czy mógłbyś podać streszczenie rozwiązania?
whuber
4
Czy to wymaga korekty ciągłości? Jak byś to zastosował?
Jack Aidley
2
Macierz kowariancji nie jest z góry określona dodatnio, ale raczej z dodatnią półokreśloną i nie ma pełnego rzędu. To powoduje, że wynikowy rozkład wielomianowy jest niezdefiniowany. Z tym problemem się spotkałem. Masz pomysł, jak sobie z tym poradzić?
Mohammad Alaggan,
2
@ M. Alaggan: Macierze średniej / kowariancji zdefiniowane tutaj mają jeden drobny problem: w przypadku rozkładu wielomianowego z zmiennymi równoważna normalna wielowymiarowa ma zmienne . Jest to widoczne w prostym dwumianowym przykładzie, który jest przybliżony (zwykłym) rozkładem normalnym. Aby uzyskać dalsze omówienie, patrz przykład 12.7 elementów teorii dystrybucji . k - 1kk1
MS Dousti
1

Gęstość podana w tej odpowiedzi jest zdegenerowana, dlatego użyłem następującego obliczenia gęstości, która wynika z normalnego przybliżenia:

Istnieje twierdzenie, które mówi, że podana zmienna losowa , dla -wymiarowego wektora z i , że;X=[X1,,Xm]TMultinom(n,p)mpipi=1iXi=n

Xdndiag(u)Q[Z1Zm10]+[np1npm],

dla dużej , dane;n

  • wektor z ;uui=pi
  • zmienne losowe dla i;ZiN(0,1)i=1,,m1
  • macierz ortogonalna z końcową kolumną .Qu

Oznacza to, że z pewną rearanżacją możemy opracować wielowymiarowy rozkład normalny wymiaru dla pierwszych składników (które są jedynymi interesującymi składnikami, ponieważ jest sumą pozostałych).m1m1XXm

Odpowiednią wartością macierzy jest z - tj. Konkretna transformacja Householdera.QI2vvTvi=(δimui)/2(1um)

Jeśli to ograniczenie w lewej do pierwszych wierszy i ograniczyć do pierwszych wierszy i kolumn (oznaczają te a , odpowiednio), a następnie:m1Qm1m1X^Q^

X^dndiag(u^)Q^[Z1Zm1]+[np1npm1]N(μ,nΣ),

dla dużych , gdzie;n

  • u^ oznacza pierwsze wyrażenia ;m1u
  • średnia to , i;μ=[np1,,npm1]T
  • macierz kowariancji z .nΣ=nAAT = diag ( U ) PA=diag(u^)Q^

Prawa strona tego końcowego równania to nie-zdegenerowana gęstość zastosowana w obliczeniach.

Zgodnie z oczekiwaniami, po podłączeniu wszystkiego otrzymasz następującą macierz kowariancji:

(nΣ)ij=npipj(δijpipj)

i,j=1,,m1m - 1m1m1

Ten wpis na blogu był moim punktem wyjścia.

stepmatyk
źródło
1
Innym przydatnym zasobem są linki podane w: stats.stackexchange.com/questions/2397/…
stephematician
1
Dobra odpowiedź (+1) --- Pamiętaj, że możesz osadzać linki w składni [textual description](hyperlink). Zezwoliłem na edytowanie tej odpowiedzi, aby osadzić Twoje linki.
Ben - Przywróć Monikę