Jaka jest różnica między tylnym a tylnym rozkładem predykcyjnym?

31

Rozumiem, co to jest posterior, ale nie jestem pewien, co oznacza ten drugi?

Czym różnią się 2?

Kevin P Murphy wskazał w swoim podręczniku Machine Learning: Probabilistic Perspective , że jest to „stan wewnętrznego przekonania”. Co to tak naprawdę oznacza? Miałem wrażenie, że przeor reprezentuje twoje wewnętrzne przekonania lub uprzedzenia, gdzie się mylę?

OGŁOSZENIE
źródło

Odpowiedzi:

36

Prosta różnica między nimi polega na tym, że rozkład tylny zależy od nieznanego parametru , tzn. Rozkład tylny to: gdzie jest stałą normalizującą.θ

p(θ|x)=c×p(x|θ)p(θ)
c

Z drugiej strony, rozkład predykcyjny z tyłu nie zależy od nieznanego parametru ponieważ został on zintegrowany, tj. Rozkład predykcyjny z tyłu wynosi: θ

p(x|x)=Θc×p(x,θ|x)dθ=Θc×p(x|θ)p(θ|x)dθ

gdzie jest nową nieobserwowaną zmienną losową i jest niezależna od .xx

Nie będę rozwodził się nad wyjaśnieniem rozkładu tylnego, ponieważ mówisz, że go rozumiesz, ale rozkład tylny „jest rozkładem nieznanej wielkości, traktowanym jako zmienna losowa, zależnym od uzyskanych dowodów” (Wikipedia). Więc w zasadzie jest to rozkład, który wyjaśnia twój nieznany, losowy parametr.

Z drugiej strony tylna dystrybucja predykcyjna ma zupełnie inne znaczenie, ponieważ jest rozkładem przyszłych prognoz opartych na danych, które już widziałeś. Zatem tylna dystrybucja predykcyjna jest zasadniczo używana do przewidywania nowych wartości danych.

Jeśli to pomaga, to przykładowy wykres rozkładu tylnego i tylnego rozkładu predykcyjnego:

wprowadź opis zdjęcia tutaj

wprowadź opis zdjęcia tutaj

Jinhua Wang
źródło
3
Ten tylny wykres predykcyjnego rozkładu wymaga nowych etykiet osi i podpisu lub czegoś takiego. Wpadłem na ten pomysł, ponieważ wiem, co to jest rozkład predykcyjny z tyłu, ale ktoś, kto go rozgryza, może się poważnie pomylić.
Cyjan
Dzięki @BabakP możesz mi również wskazać, jakiej dystrybucji użyłeś do wykreślenia pmf teta, a P (x * | theta)
AD
... bo chciałbym wypracować pełny przykład.
AD
Udawałem, że moim późniejszym był Beta (3,2). Tak naprawdę nic nie wypracowałem. Ale oczywiście, jeśli chcesz przykład, załóż, że prawdopodobieństwo jest dwumianowe (n, p), a wcześniejszy na p to Beta (a, b), to powinieneś być w stanie uzyskać, że tylny jest ponownie rozkładem beta .
Poza tym, ta przewidywana później nie jest łatwa do wyprowadzenia. Właśnie wziąłem wykres z jakiegoś kodu Procesu Gaussa, który napisałem dla predykcyjnego posteriora GP. A powiedziawszy to, tylna tylna i tylna fabuła predykcyjna w rzeczywistości nie odpowiadają pokazanemu później, oba są arbitralne.
11

Rozkład predykcyjny jest zwykle stosowany, gdy nauczyłeś się rozkładu tylnego parametru parametru pewnego rodzaju modelu predykcyjnego. Na przykład w regresji liniowej Bayesa uczysz się rozkładu tylnego nad parametrem w modelu y = wX, biorąc pod uwagę niektóre obserwowane dane X.
Następnie, gdy pojawia się nowy niewidzialny punkt danych x *, chcesz znaleźć rozkład w stosunku do możliwych prognoz y * biorąc pod uwagę rozkład tylny dla w, którego właśnie się nauczyłeś. Ten rozkład w stosunku do możliwych wartości y * podanych dla a w jest rozkładem predykcyjnym.

użytkownik1893354
źródło
5

Odnoszą się do rozkładów dwóch różnych rzeczy.

Rozkład tylny odnosi się do rozkładu parametru , natomiast przewidywany rozkład tylny (PPD) odnosi się do rozkładu przyszłych obserwacji danych .

SPMQET
źródło