Chociaż lubię myśleć, że dobrze rozumiem pojęcie wcześniejszych informacji w bayesowskiej analizie statystycznej i podejmowaniu decyzji, często mam problem z otuleniem się o jej zastosowanie. Mam na myśli kilka sytuacji, które są przykładami moich zmagań i uważam, że nie zostały one właściwie omówione w bayesowskich podręcznikach statystycznych, które do tej pory czytałem:
Powiedzmy, że kilka lat temu przeprowadziłem ankietę, z której wynika, że 68% osób byłoby zainteresowanych zakupem produktu ACME. Postanawiam ponownie uruchomić ankietę. Podczas gdy będę używać tej samej wielkości próbki, co ostatnim razem (powiedzmy, n = 400), opinie ludzi prawdopodobnie się zmieniły od tego czasu. Jeśli jednak skorzystam wcześniej z dystrybucji wersji beta, w której 272 z 400 respondentów odpowiedziało „tak”, przywiązywałbym wagę do ankiety, którą przeprowadziłem kilka lat temu i tej, którą prowadzę teraz. Czy istnieje ogólna reguła, aby ustalić większą niepewność, którą chciałbym postawić na przeorze, ponieważ dane te mają kilka lat? Rozumiem, że mogę po prostu zmniejszyć liczbę uprzednich z 272/400 do, powiedzmy, 136/200, ale wydaje się to niezwykle arbitralne i zastanawiam się, czy istnieje jakaś forma uzasadnienia, być może w literaturze,
Na inny przykład, powiedzmy, że mamy zamiar przeprowadzić badanie kliniczne. Przed rozpoczęciem badania przeprowadzamy kilka badań wtórnych, które możemy wykorzystać jako wstępne informacje, w tym opinie ekspertów, wyniki wcześniejszych badań klinicznych (o różnym znaczeniu), inne podstawowe fakty naukowe itp. W jaki sposób można połączyć to spektrum informacji (niektóre z nich mają charakter nieilościowy) do wcześniejszego rozkładu prawdopodobieństwa? Czy to tylko kwestia podjęcia decyzji, którą rodzinę wybrać i sprawić, by była wystarczająco rozproszona, aby zapewnić, że dane zostaną przytłoczone, czy też jest wiele pracy włożonej w ustalenie wcześniejszej dość pouczającej dystrybucji?
Odpowiedzi:
Twój pomysł, aby traktować swoje wcześniejsze informacje o 272 sukcesach w 400 próbach, ma dość solidne uzasadnienie bayesowskie.
Problem, z którym masz do czynienia, jak zauważyłeś, polega na oszacowaniu prawdopodobieństwa sukcesuθ eksperymentu Bernoulliego. Dystrybucja Beta jest odpowiednim „wcześniejszym sprzężeniem”. Tacy sprzężeni priory cieszą się „fikcyjną interpretacją próbek”:
Beta Prior to
ale zwiększa poprzednią wariancję od
do
zgodnie z życzeniem.
źródło