Prosta różnica między nimi polega na tym, że rozkład tylny zależy od nieznanego parametru , tzn. Rozkład tylny to:
gdzie jest stałą normalizującą.θp(θ|x)=c×p(x|θ)p(θ)
c
Z drugiej strony, rozkład predykcyjny z tyłu nie zależy od nieznanego parametru ponieważ został on zintegrowany, tj. Rozkład predykcyjny z tyłu wynosi:
θp(x∗|x)=∫Θc×p(x∗,θ|x)dθ=∫Θc×p(x∗|θ)p(θ|x)dθ
gdzie jest nową nieobserwowaną zmienną losową i jest niezależna od .x∗x
Nie będę rozwodził się nad wyjaśnieniem rozkładu tylnego, ponieważ mówisz, że go rozumiesz, ale rozkład tylny „jest rozkładem nieznanej wielkości, traktowanym jako zmienna losowa, zależnym od uzyskanych dowodów” (Wikipedia). Więc w zasadzie jest to rozkład, który wyjaśnia twój nieznany, losowy parametr.
Z drugiej strony tylna dystrybucja predykcyjna ma zupełnie inne znaczenie, ponieważ jest rozkładem przyszłych prognoz opartych na danych, które już widziałeś. Zatem tylna dystrybucja predykcyjna jest zasadniczo używana do przewidywania nowych wartości danych.
Jeśli to pomaga, to przykładowy wykres rozkładu tylnego i tylnego rozkładu predykcyjnego:
Rozkład predykcyjny jest zwykle stosowany, gdy nauczyłeś się rozkładu tylnego parametru parametru pewnego rodzaju modelu predykcyjnego. Na przykład w regresji liniowej Bayesa uczysz się rozkładu tylnego nad parametrem w modelu y = wX, biorąc pod uwagę niektóre obserwowane dane X.
Następnie, gdy pojawia się nowy niewidzialny punkt danych x *, chcesz znaleźć rozkład w stosunku do możliwych prognoz y * biorąc pod uwagę rozkład tylny dla w, którego właśnie się nauczyłeś. Ten rozkład w stosunku do możliwych wartości y * podanych dla a w jest rozkładem predykcyjnym.
źródło
Odnoszą się do rozkładów dwóch różnych rzeczy.
Rozkład tylny odnosi się do rozkładu parametru , natomiast przewidywany rozkład tylny (PPD) odnosi się do rozkładu przyszłych obserwacji danych .
źródło