Dlaczego rozkład Dirichleta jest priorytetem w dystrybucji wielomianowej?

36

W algorytmie modelu tematycznego LDA widziałem to założenie. Ale nie wiem, dlaczego wybrał dystrybucję Dirichleta? Nie wiem, czy możemy użyć Uniform Distribution na Multinomial jako parę?

ColinBinWang
źródło
5
Rozkład równomierny jest szczególnym przypadkiem rozkładu dirichleta.
Stumpy Joe Pete

Odpowiedzi:

60

Rozkład Dirichleta jest sprzężony przed rozkładem wielomianowym. Oznacza to, że jeśli wcześniejszym rozkładem parametrów wielomianowych jest Dirichlet, to rozkład tylny jest również rozkładem Dirichleta (z parametrami innymi niż parametry wcześniejsze). Zaletą tego jest to, że (a) rozkład tylny jest łatwy do obliczenia i (b) w pewnym sensie możliwe jest oszacowanie, jak bardzo zmieniły się nasze przekonania po zebraniu danych.

Z pewnością można przedyskutować, czy są to dobre powody, aby wybrać konkretny przeor, ponieważ kryteria te nie są związane z faktycznymi wcześniejszymi przekonaniami ... Niemniej jednak sprzężone przeory są popularne, ponieważ często są dość elastyczne i wygodne w użyciu z powodów wymienionych powyżej. .

W szczególnym przypadku rozkładu wielomianowego niech będzie wektorem parametrów wielomianowych (tj. Prawdopodobieństw dla różnych kategorii). Jeśli ( p 1 , , p k ) Dirichlet ( α 1 , , α k ) przed zebraniem danych, to biorąc pod uwagę obserwacje ( x 1 , , x k ) w różnych kategoriach, ((p1,,pk)

(p1,,pk)Dirichlet(α1,,αk)
(x1,,xk)
(p1,,pk)|(x1,,xk)Dirichlet(α1+x1,,αk+xk).

α1=α2)==αk=1α1==αk=1/2)

MånsT
źródło
Dlatego wybraliśmy dystrybucję Dirichleta dla tych korzyści.
ColinBinWang
1
+1: Możesz wyraźnie powiedzieć, że prawdopodobieństwo jest koniecznie Dirichleta, dlatego rozkład tylny jest łatwy do obliczenia.
Neil G,
18

Oprócz sprzeczności z odpowiedzią Månsa T , po prostu zaznaczam, że w modelowaniu bayesowskim nie ma czegoś takiego jak „wcześniejsze”! Rozkład Dirichleta jest wygodnym wyborem ze względu na (a) sprzężenie, (b) obliczenia i (c) połączenie ze statystykami nieparametrycznymi (ponieważ jest to dyskretna wersja procesu Dirichleta).

Jednak (i) cokolwiek wcześniej nałożysz na wagi wielomianu jest uzasadnioną odpowiedzią na subiektywnym poziomie Bayesa oraz (ii) w przypadku wcześniejszej informacji, nie ma powodu, aby uprościć ją do rozkładu Dirichleta. Należy również zauważyć, że mieszaniny i zwoje rozkładów Dirichleta mogą być użyte jako priory.

Xi'an
źródło