Pewnie. Jest to zasadniczo spostrzeżenie, że rozkład Dirichleta jest sprzężony przed rozkładem wielomianowym. Oznacza to, że mają taką samą funkcjonalną formę. Artykuł wspomina o tym, ale podkreślę, że wynika to z modelu wielomianowego próbkowania. Przejdźmy do tego ...
Obserwacja dotyczy tylnej części ciała, więc wprowadźmy pewne dane , które są liczbami różnych pozycji. Obserwujemy łącznie próbek. Zakładamy, że jest pobierany z nieznanej dystrybucji (na której umieścimy przed simplex).K N = ∑ K i = 1 x i x π D i r ( α ) KxK.N.= ∑K.i = 1xjaxπD i r (α)K.
Prawdopodobieństwo późniejsze podanego i danych wynosiα xπαx
p ( π| x,α)=p(x | π) p ( π| α)
Prawdopodobieństwo, , jest rozkładem wielomianowym. Teraz napiszmy pdf:p ( x | π)
p ( x | π) = N!x1! ⋯ xk!πx11⋯ πxkk
i
p ( π| α)= 1B (α)∏i = 1K.πα - 1ja
gdzie . Mnożąc, widzimy, żeB (α)= Γ ( α )K.Γ(Kα)
p(π|α,x)=p(x|π)p(π|α)∝∏i=1Kπxi+α−1i.
Innymi słowy, tylnym jest również Dirichlet. Pytanie dotyczyło środka pośrodku. Ponieważ tylnym jest Dirichlet, możemy zastosować wzór na średnią Dirichleta, aby to ustalić,
mi[ πja| α,x]= xja+ αN.+ Kα.
Mam nadzieję że to pomoże!
Na marginesie, chciałbym również dodać kolejny punkt do powyższej pochodnej, który tak naprawdę nie dotyczy głównego pytania. Mówiąc jednak o priory Dirichleta o rozkładzie wielomianowym, pomyślałem, że warto wspomnieć, jaka byłaby forma funkcji prawdopodobieństwa, gdybyśmy przyjmowali prawdopodobieństwa za zmienne uciążliwe.
Jak słusznie wskazuje sydeulissie, jest proporcjonalne do . Teraz chciałbym obliczyć .p ( π| α,x) ∏K.i = 1πxja+ α - 1ja p ( x | α )
Używając integralnej tożsamości dla funkcji gamma, mamy:
Powyższe wyprowadzenie prawdopodobieństwa dla danych kategorycznych proponuje bardziej niezawodny sposób radzenia sobie z tymi danymi w przypadkach, gdy wielkość próby nie jest wystarczająco duża.N.
źródło