Znam 3 metody szacowania parametrów, ML, MAP i podejście Bayesa. A jeśli chodzi o MAP i podejście Bayesa, musimy wybrać priory dla parametrów, prawda?
Powiedzmy, że mam ten model , w którym α , β są parametrami, aby dokonać oszacowania za pomocą MAP lub Bayesa, przeczytałem w książce, że lepiej wybrać koniugat przed p ( α , β ) , które jest łącznym prawdopodobieństwem α , β , prawda?
Mam 2 pytania:
Czy mamy inne możliwości wyboru poprzedniej niż ta sprzężona?
Czy możemy wybrać priorytety dla odpowiednio i β, takie jak p ( α ) i p ( β ) , inne niż połączyć je razem?
bayesian
estimation
prior
awokado
źródło
źródło
Odpowiedzi:
Jak stwierdzono w komentarzu, wcześniejsza dystrybucja reprezentuje wcześniejsze przekonania na temat dystrybucji parametrów.
Gdy faktycznie dostępne są wcześniejsze przekonania, możesz:
Jeśli nie są dostępne żadne wyraźne wcześniejsze przekonania, możesz:
źródło
Istnieje również empiryczny Bayes. Chodzi o to, aby dostroić dane przed:
Choć na początku może się to wydawać niezręczne, istnieją tak naprawdę relacje do minimalnej długości opisu. Jest to również typowy sposób szacowania parametrów jądra procesów Gaussa.
źródło
Aby bezpośrednio odpowiedzieć na dwa powyższe pytania:
Masz inne możliwości wyboru innych niż sprzężone priory. Problem polega na tym, że jeśli wybierzesz nie-sprzężone priory, nie możesz dokonać dokładnego wnioskowania bayesowskiego (krótko mówiąc, nie możesz wyprowadzić bliższej postaci tylnej). Zamiast tego musisz dokonać przybliżonego wnioskowania lub zastosować metody próbkowania, takie jak próbkowanie Gibbsa, próbkowanie odrzucenia, MCMC itp., Aby wyprowadzić cię z tyłu. Problem z metodami próbkowania polega na tym, że intuicyjnie przypomina to rysowanie słonia w ciemności poprzez powtarzalne dotykanie go - możesz być stronniczy i niekompletny. Powodem, dla którego ludzie wybierają opcję wcześniejszą niż koniugat, jest to, że z pewnym prawdopodobieństwem opcja wcześniejszej koniugatu jest dość ograniczona lub, powiedzmy, większość nie jest sprzężona.
Tak, zdecydowanie możesz. Jeśli α i β są niezależne, co jest warunkiem idealistycznym, można uzyskać ich łączny rozkład na podstawie p (α) p (β). Jeśli nie są one niezależne, konieczne może być ustalenie prawdopodobieństwa warunkowego i wykonanie całki w celu uzyskania rozkładu połączeń.
źródło