Wybieranie między nieinformacyjnymi wersjami beta

17

Szukam nieinformacyjnych priorytetów dla dystrybucji beta do pracy z procesem dwumianowym (Hit / Miss). Na początku myślałem o użyciu α=1,β=1 które generują jednolity plik PDF, lub Jeffrey przed α=0.5,β=0.5 . Ale tak naprawdę szukam priorów, które mają minimalny wpływ na późniejsze wyniki, a potem pomyślałem o użyciu niewłaściwego przed α=0,β=0 . Problem polega na tym, że moja tylna dystrybucja działa tylko wtedy, gdy mam przynajmniej jedno trafienie i jedno chybienie. Aby temu zaradzić, pomyślałem o użyciu bardzo małej stałej , aby zapewnić, że tylne α i β będą > 0 .α=0.0001,β=0.0001αβ>0

Czy ktoś wie, czy takie podejście jest dopuszczalne? Widzę liczbowe efekty zmiany tych wcześniejszych, ale ktoś mógłby dać mi jakąś interpretację umieszczania małych stałych takich jak ta jako priorytety?

Mateus
źródło
1
W przypadku dużych próbek z dużą ilością trafień i braków nie ma to większego znaczenia. W przypadku małych próbek, zwłaszcza jeśli nie ma co najmniej jednego trafienia i jednego pudła, robi to dużą różnicę; nawet rozmiar „bardzo małej stałej” może mieć znaczący wpływ. Proponuję eksperyment myślowy kluczową dla mógłbyś być, jakiego rodzaju posterior sens po próbki wielkości : to może cię przekonać, że coś takiego jak Jeffrey s przed jest racjonalna1
Henry
I jest artykuł Kerman sugerujący 1/3 i 1/3, b
Björn
Co rozumiesz przez „minimalny wpływ na wyniki późniejsze”? W porównaniu do czego?
Czy
Poprawiłem formatowanie i tytuł twojego pytania, przywróć lub zmień zmiany.
Tim

Odpowiedzi:

33

Przede wszystkim nie ma czegoś takiego jak nieinformacyjny przeor . Poniżej widać rozkłady tylne wynikające z pięciu różnych „nieinformacyjnych” priorów (opisanych poniżej wykresu) podanych różnych danych. Jak wyraźnie widać, wybór „nieinformacyjnych” priorów wpłynął na rozkład tylny, szczególnie w przypadkach, gdy same dane nie dostarczały zbyt wielu informacji .

Tylne ściany z nieinformacyjnych przeorów

α=βα1,β1α=β=1α=β=1/2α=β=1/3α=β=0α=β=εε>0 ) (patrz także świetny artykuł na Wikipedii ).

αβyn

θyB(α+y,β+ny)

α,βα=β=1n

Na pierwszy rzut oka Haldane wcześniej wydaje się być najbardziej „nieinformacyjny”, ponieważ prowadzi do średniej tylnej, która jest dokładnie równa oszacowaniu maksymalnego prawdopodobieństwa

α+yα+y+β+ny=y/n

y=0y=n

Istnieje wiele argumentów za i przeciw każdemu z „nieinformacyjnych” priorów (patrz Kerman, 2011; Tuyl i in., 2008). Na przykład, jak omówili Tuyl i in.,

101

Z drugiej strony, stosowanie jednolitych priorytetów dla małych zestawów danych może mieć bardzo duży wpływ (pomyśl o tym w kategoriach pseudo-rachunków). O wiele więcej informacji i dyskusji na ten temat można znaleźć w wielu artykułach i podręcznikach.

Przykro mi, ale nie ma żadnych priorytetów „najlepszy”, „najbardziej nieinformacyjny” lub „jeden rozmiar”. Każdy z nich wprowadza do modelu pewne informacje.

Kerman, J. (2011). Neutralne nieinformacyjne i pouczające sprzężone beta i gamma wcześniejsze dystrybucje. Electronic Journal of Statistics, 5, 1450-1470.

Tuyl, F., Gerlach, R. i Mengersen, K. (2008). Porównanie Bayesa-Laplace'a, Jeffreysa i innych przełożonych. The American Statistician, 62 (1): 40–44.

Tim
źródło