Jak sformalizować wcześniejszy rozkład prawdopodobieństwa? Czy istnieją zasady praktyczne lub wskazówki, których należy używać?

9

Chociaż lubię myśleć, że dobrze rozumiem pojęcie wcześniejszych informacji w bayesowskiej analizie statystycznej i podejmowaniu decyzji, często mam problem z otuleniem się o jej zastosowanie. Mam na myśli kilka sytuacji, które są przykładami moich zmagań i uważam, że nie zostały one właściwie omówione w bayesowskich podręcznikach statystycznych, które do tej pory czytałem:

Powiedzmy, że kilka lat temu przeprowadziłem ankietę, z której wynika, że ​​68% osób byłoby zainteresowanych zakupem produktu ACME. Postanawiam ponownie uruchomić ankietę. Podczas gdy będę używać tej samej wielkości próbki, co ostatnim razem (powiedzmy, n = 400), opinie ludzi prawdopodobnie się zmieniły od tego czasu. Jeśli jednak skorzystam wcześniej z dystrybucji wersji beta, w której 272 z 400 respondentów odpowiedziało „tak”, przywiązywałbym wagę do ankiety, którą przeprowadziłem kilka lat temu i tej, którą prowadzę teraz. Czy istnieje ogólna reguła, aby ustalić większą niepewność, którą chciałbym postawić na przeorze, ponieważ dane te mają kilka lat? Rozumiem, że mogę po prostu zmniejszyć liczbę uprzednich z 272/400 do, powiedzmy, 136/200, ale wydaje się to niezwykle arbitralne i zastanawiam się, czy istnieje jakaś forma uzasadnienia, być może w literaturze,

Na inny przykład, powiedzmy, że mamy zamiar przeprowadzić badanie kliniczne. Przed rozpoczęciem badania przeprowadzamy kilka badań wtórnych, które możemy wykorzystać jako wstępne informacje, w tym opinie ekspertów, wyniki wcześniejszych badań klinicznych (o różnym znaczeniu), inne podstawowe fakty naukowe itp. W jaki sposób można połączyć to spektrum informacji (niektóre z nich mają charakter nieilościowy) do wcześniejszego rozkładu prawdopodobieństwa? Czy to tylko kwestia podjęcia decyzji, którą rodzinę wybrać i sprawić, by była wystarczająco rozproszona, aby zapewnić, że dane zostaną przytłoczone, czy też jest wiele pracy włożonej w ustalenie wcześniejszej dość pouczającej dystrybucji?

Phil
źródło

Odpowiedzi:

4

Twój pomysł, aby traktować swoje wcześniejsze informacje o 272 sukcesach w 400 próbach, ma dość solidne uzasadnienie bayesowskie.

Problem, z którym masz do czynienia, jak zauważyłeś, polega na oszacowaniu prawdopodobieństwa sukcesu θeksperymentu Bernoulliego. Dystrybucja Beta jest odpowiednim „wcześniejszym sprzężeniem”. Tacy sprzężeni priory cieszą się „fikcyjną interpretacją próbek”:

Beta Prior to

π(θ)=Γ(α0+β0)Γ(α0)Γ(β0)θα0-1(1-θ)β0-1
Można to interpretować jako informację zawartą w próbce wielkości n_=α0+β0-2) (luźno tak, jak n_ oczywiście nie musi być liczbą całkowitą) α0-1 sukcesy:
π(θ)=Γ(α0+β0)Γ(α0)Γ(β0)θα0-1(1-θ)n_-(α0-1)
Dlatego jeśli weźmiesz α0+β0-2)=400 i α0-1=272odpowiada to wcześniejszym parametrom α0=273 i β0=129. „Zmniejszenie o połowę” próbki doprowadziłoby do wcześniejszych parametrówα0=137 i β0=65. Przypomnijmy teraz, że wcześniejszą średnią i wcześniejszą wariancję rozkładu beta podano przez
μ=αα+βiσ2)=αβ(α+β)2)(α+β+1)
Zmniejszenie o połowę próbki pozwala zachować (prawie) wcześniejszą średnią:
alpha01 <- 273
beta01 <- 129
(mean01 <- alpha01/(alpha01+beta01))

alpha02 <- 137
beta02 <- 65
(mean02 <- alpha02/(alpha02+beta02))

ale zwiększa poprzednią wariancję od

(priorvariance01 <- (alpha01*beta01)/((alpha01+beta01)^2*(alpha01+beta01+1)))
[1] 0.0005407484

do

(priorvariance02 <- (alpha02*beta02)/((alpha02+beta02)^2*(alpha02+beta02+1)))
[1] 0.001075066

zgodnie z życzeniem.

Christoph Hanck
źródło