Stała normalizująca w twierdzeniu Bayesa

15

Pr(data)

Pr(parametersdata)=Pr(dataparameters)Pr(parameters)Pr(data)

nazywa się stałą normalizującą . Co to dokładnie jest Jaki jest jego cel? Dlaczego wygląda na ? Dlaczego to nie zależy od parametrów?Pr(data)

amator
źródło
4
Kiedy integrujesz , integrujesz parametry, więc wynik nie zawiera żadnego terminu zależnego od parametrów, w taki sam sposób, jak nie zależy od . x = 2 x = 0 x yf(data|params)f(params)xx=0x=2xydx=2yx
Henry

Odpowiedzi:

16

Mianownik, , jest uzyskiwany przez całkowanie parametrów z prawdopodobieństwa złączenia,Pr ( dane , parametry )Pr(data)Pr(data,parameters) . Jest to krańcowe prawdopodobieństwo danych i, oczywiście, nie zależy od parametrów, ponieważ zostały one zintegrowane.

Teraz, ponieważ:

  • Pr(data) nie zależy od parametrów, dla których chce się wnioskować;
  • Pr(data) jest ogólnie trudny do obliczenia w formie zamkniętej;

często stosuje się następującą adaptację formuły Baye'a:

Pr(parametersdata)Pr(dataparameters)Pr(parameters)

Zasadniczo jest niczym innym jak „stałą normalizującą”, tj. Stałą, która integruje tylną gęstość z jednym .Pr(data)

ocram
źródło
2
Co dokładnie rozumiesz przez „ integrując parametry”? Jakie jest dokładne znaczenie „integracji” w tym kontekście?
nro
2
@nbro: Mam na myśli Pr (dane) = całka ponad parametrami Pr (dane, parametry)
ocram
2

Stosując zasadę Bayesa, zwykle chcemy wnioskować o „parametrach”, a „dane” są już podane. Zatem jest stałą i możemy założyć, że jest to tylko czynnik normalizujący.Pr(data)

Szorstki
źródło