Obliczanie prawdopodobieństwa logarytmicznego dla danego MLE (łańcuchy Markowa)

9

Obecnie pracuję z łańcuchami Markowa i obliczyłem oszacowanie maksymalnego prawdopodobieństwa przy użyciu prawdopodobieństw przejścia, jak sugeruje kilka źródeł (tj. Liczba przejść od a do b podzielona przez liczbę całkowitych przejść od a do innych węzłów).

Chcę teraz obliczyć logarytmiczne prawdopodobieństwo MLE.

społeczność
źródło
Już obliczyłeś maksymalne prawdopodobieństwo prawdopodobieństwa przejścia, a teraz chcesz obliczyć logarytm prawdopodobieństwa, co dokładnie?
Nick

Odpowiedzi:

11

Niech będzie ścieżką łańcucha markowa i niech będzie prawdopodobieństwem zaobserwowania ścieżki, gdy jest prawdziwa wartość parametru (znana również jako funkcja prawdopodobieństwa dla ). Używając definicji prawdopodobieństwa warunkowego, wiemy{Xi}i=1TPθ(X1,...,XT)θθ

Pθ(X1,...,XT)=Pθ(XT|XT1,...,X1)Pθ(X1,...,XT1)

Ponieważ jest to łańcuch markowa, wiemy, że , więc to upraszcza to doPθ(XT|XT1,...,X1)=Pθ(XT|XT1)

Pθ(X1,...,XT)=Pθ(XT|XT1)Pθ(X1,...,XT1)

Teraz, jeśli powtórzysz tę samą logikę razy, otrzymaszT

Pθ(X1,...,XT)=i=1TPθ(Xi|Xi1)

gdzie należy interpretować jako stan początkowy procesu. Terminy po prawej stronie są tylko elementami macierzy przejścia. Ponieważ żądano prawdopodobieństwa dziennika, ostateczna odpowiedź brzmi:X0

L(θ)=i=1Tlog(Pθ(Xi|Xi1))

Jest to prawdopodobieństwo pojedynczego łańcucha markowa - jeśli twój zestaw danych zawiera kilka (niezależnych) łańcuchów markowa, pełne prawdopodobieństwo będzie sumą warunków tego formularza.

Makro
źródło
Wow, wielkie dzięki za odpowiedź. W tym przypadku to prawdopodobieństwo „przejścia” zaczerpnięte z MLE, prawda? Pθ
fsociety
@ph_singer, nie ma za co. to prawdopodobieństwo przejścia ze stanu do , biorąc pod uwagę wartość parametru, . Jeśli nie nałożyłeś żadnej struktury na macierz przejścia (tak to brzmi), to oznacza po prostu wektor prawdopodobieństwa przejścia (a MLE są tylko proporcjami próbki, jak poprawnie wskazałeś w pytaniu), więc tak : będzie tylko próbną proporcją ruchów ze stanu które zakończyły się w stanie . Pθ(Xi|Xi1)Xi1XiθθPθ^MLE(Xi|Xi1)Xi1Xi
Makro
Dzięki jeszcze raz! Jeszcze jedno pytanie: jeśli użyję innego zamówienia (np. K = 2), jak przebiegnie ten proces?
fsociety
Czy możesz wyjaśnić, co rozumiesz przez „zamówienie”?
Makro
(+1) OP prawdopodobnie oznacza dla oznaczenia MC drugiego rzędu , tj. W zależności od dwóch poprzednich stanów a nie tylko ostatniego . k=2Xi1,Xi2Xi1
kardynał