Jakie wcześniejsze rozkłady mogłyby / powinny być zastosowane dla wariancji w hierarchicznym modelu bayezjańskim, gdy interesująca jest średnia wariancja?

16

W szeroko cytowanym artykule Wcześniejsze rozkłady parametrów wariancji w modelach hierarchicznych (916 cytowanie do tej pory na Google Scholar) Gelman sugeruje, że dobre wcześniejsze nieinformacyjne wcześniejsze rozkłady dla wariancji w hierarchicznym modelu bayesowskim to rozkład równomierny i rozkład połowy t. Jeśli dobrze rozumiem, działa to dobrze, gdy parametr lokalizacji (np. Średnia) jest najważniejszy. Czasami parametr wariancji jest przedmiotem głównego zainteresowania, na przykład przy analizie danych ludzkich odpowiedzi z zadań synchronizacji, zmienność pomiaru czasu jest często miarą zainteresowania. W tych przypadkach nie jest dla mnie jasne, w jaki sposób zmienność może być modelowana hierarchicznie, na przykład z jednolitymi rozkładami, ponieważ ja po analizie chcę uzyskać wiarygodność średniej wariancji zarówno na poziomie uczestnika, jak i na poziomie grupy.

Moje pytanie brzmi zatem: jakie rozkłady są zalecane przy budowaniu hierarchicznego modelu bayesowskiego, gdy wariancja danych jest najważniejsza?

Wiem, że rozkład gamma można sparametryzować, aby określić go za pomocą średniej i SD. Na przykład poniższy model hierarchiczny pochodzi z książki Kruschke Doing Bayesian Data Analysis . Ale Gelman opisuje pewne problemy z rozkładem gamma w swoim artykule i byłbym wdzięczny za sugestie dotyczące alternatyw, najlepiej alternatyw, które nie są trudne do podjęcia w BŁĘDACH / JAGSACH.

wprowadź opis zdjęcia tutaj

Rasmus Bååth
źródło

Odpowiedzi:

2

Nie zgadzam się ze sposobem, w jaki interpretujesz Gelmana odnośnie wyboru parametru Gamma dla skali. Podstawą modelowania hierarchicznego jest powiązanie poszczególnych parametrów ze wspólnym poprzez strukturę o nieznanych (zwykle średnich i wariancji) parametrach. W tym sensie zastosowanie rozkładu gamma dla pojedynczej wariancji (lub logarytm normalny dla cięższego ogona) uwarunkowane średnią wariancją, a jej dyspersja wydaje mi się ważna (przynajmniej w odniesieniu do argumentów Gelmana).

Krytycy Gelmana na temat parametru gamma dla parametru skali odnoszą się do faktu, że gamma jest używana do przybliżenia Jeffreysa poprzez ustawienie ekstremalnych wartości na jego parametr. Problem polega na tym, że w zależności od tego, jak ekstremalne są te wartości (co jest dość arbitralne), tył może być bardzo różny. Ta obserwacja unieważnia użycie tego wcześniejszego, przynajmniej wtedy, gdy nie mamy informacji do ustawienia w poprzednim. W tej dyskusji wydaje mi się, że gamma lub odwrotna gamma nigdy nie jest skalibrowana pod względem średniej i wariancji na podstawie wcześniejszych informacji lub struktury hierarchicznej. Zatem jego zalecenie dotyczy kontekstu zupełnie innego niż twój, który, jeśli dobrze rozumiem twój cel,

peuhp
źródło
0

Krótko mówiąc, Gelman przedstawia problemy z wykorzystaniem rozkładów gamma jako niejasnych (używa słowa noninformative ) priorów dla wariancji. Przeciwnie, twój problem (i przykład Kruschke) wydaje się odnosić do przypadku, w którym istnieje pewna wiedza na temat wariancji. Zauważ też, że obraz rozkładu wariancji wcale nie jest płaski.τja

altroware
źródło