Jeśli istnieje wiele możliwych przybliżeń, szukam najbardziej podstawowego.
źródło
Jeśli istnieje wiele możliwych przybliżeń, szukam najbardziej podstawowego.
Można to przybliżyć za pomocą wielowymiarowego rozkładu normalnego w taki sam sposób, w jaki rozkład dwumianowy jest aproksymowany przez jednowymiarowy rozkład normalny. Sprawdź elementy teorii dystrybucji i dystrybucji wielomianowej strony 15-16-17.
Niech będzie wektorem prawdopodobieństw. Zatem średni wektor wielowymiarowego rozkładu normalnego wynosi . Macierz kowariancji jest macierzą symetryczną . Elementy diagonalne są w rzeczywistości wariancją ; tj. , . Element nie przekątny w i-tym wierszu i j-tej kolumnie to , gdzie nie jest równe .n P = ( N s 1 , n p 2 , . . . , N p k ) k x k x i n s I ( 1 - P i ) i = 1 , 2 ... , k Cov ( X i , X j i j
Gęstość podana w tej odpowiedzi jest zdegenerowana, dlatego użyłem następującego obliczenia gęstości, która wynika z normalnego przybliżenia:
Istnieje twierdzenie, które mówi, że podana zmienna losowa , dla -wymiarowego wektora z i , że;X=[X1,…,Xm]T∼Multinom(n,p) m p ∑ipi=1 ∑iXi=n
dla dużej , dane;n
Oznacza to, że z pewną rearanżacją możemy opracować wielowymiarowy rozkład normalny wymiaru dla pierwszych składników (które są jedynymi interesującymi składnikami, ponieważ jest sumą pozostałych).m−1 m−1 X Xm
Odpowiednią wartością macierzy jest z - tj. Konkretna transformacja Householdera.Q I−2vvT vi=(δim−ui)/2(1−um)−−−−−−−−√
Jeśli to ograniczenie w lewej do pierwszych wierszy i ograniczyć do pierwszych wierszy i kolumn (oznaczają te a , odpowiednio), a następnie:m−1 Q m−1 m−1 X^ Q^
dla dużych , gdzie;n
Prawa strona tego końcowego równania to nie-zdegenerowana gęstość zastosowana w obliczeniach.
Zgodnie z oczekiwaniami, po podłączeniu wszystkiego otrzymasz następującą macierz kowariancji:
Ten wpis na blogu był moim punktem wyjścia.
źródło
[textual description](hyperlink)
. Zezwoliłem na edytowanie tej odpowiedzi, aby osadzić Twoje linki.