Jeśli mamy małą próbkę, czy wcześniejszy rozkład będzie miał duży wpływ na rozkład tylny?
bayesian
sample-size
prior
Toby J.
źródło
źródło
Odpowiedzi:
Tak. Rozkład tylny dla parametru danym zestawie danych można zapisać jakoθ X
lub, jak to jest częściej wyświetlane na skali dziennika,
Prawdopodobieństwo dziennika, , skaluje się z wielkością próbki , ponieważ jest to funkcja dane, podczas gdy poprzednia gęstość nie. Dlatego wraz ze wzrostem wielkości próbki wartość bezwzględna staje się większa, podczas gdy pozostaje na stałym poziomie (dla stałej wartości ), a zatem suma staje się silniej pod wpływem wraz ze wzrostem wielkości próby.L(θ;X)=log(p(X|θ)) L(θ;X) log(p(θ)) θ L(θ;X)+log(p(θ)) L(θ;X)
Dlatego, aby bezpośrednio odpowiedzieć na twoje pytanie - poprzednia dystrybucja staje się coraz mniej istotna, ponieważ prawdopodobieństwo przeważa. Tak więc, dla małej wielkości próbki, wcześniejsza dystrybucja odgrywa znacznie większą rolę. Zgadza się to z intuicją, ponieważ można by oczekiwać, że wcześniejsze specyfikacje odegrałyby większą rolę, gdy nie ma zbyt wielu danych, aby je obalić, natomiast jeśli wielkość próbki jest bardzo duża, sygnał obecny w danych przeważa cokolwiek a priori przekonania zostały wprowadzone do modelu.
źródło
Oto próba zilustrowania ostatniego akapitu doskonałej odpowiedzi Makra (+1). Pokazuje dwa priorytety dla parametru w rozkładzie . Dla kilku różnych , rozkłady tylne są pokazane, gdy zaobserwowano . Gdy rośnie, oba tylne stają się coraz bardziej skoncentrowane wokół .p Binomial(n,p) n x=n/2 n 1/2
Dla różnica jest dość duża, ale dla praktycznie nie ma różnicy.n=2 n=50
Dwa poniższe priorytety to (czarny) i (czerwony). Tylniacze mają takie same kolory jak przeorowie, z których pochodzą.Beta(1/2,1/2) Beta(2,2)
(Pamiętaj, że dla wielu innych modeli i innych priorytetów nie wystarczy, aby wcześniejsze nie miało znaczenia!)n=50
źródło