Problem
Piszę funkcję R, która wykonuje analizę bayesowską w celu oszacowania gęstości tylnej, biorąc pod uwagę świadomy uprzedni i dane. Chciałbym, aby funkcja wysłała ostrzeżenie, jeśli użytkownik będzie musiał ponownie rozważyć wcześniejsze.
W tym pytaniu chcę dowiedzieć się, jak oceniać przeor. Poprzednie pytania dotyczyły mechaniki przedstawiania świadomych priorów ( tu i tutaj .)
Następujące przypadki mogą wymagać ponownej oceny wcześniejszego:
- dane stanowią skrajny przypadek, który nie został uwzględniony przy stwierdzaniu wcześniejszego
- błędy w danych (np. jeśli dane są w jednostkach g, gdy uprzednio jest w kg)
- zły zbiór został wybrany z zestawu dostępnych priorów z powodu błędu w kodzie
W pierwszym przypadku priory są zwykle wystarczająco rozproszone, aby dane ogólnie je przytłoczyły, chyba że wartości danych leżą w nieobsługiwanym zakresie (np. <0 dla logN lub gamma). Pozostałe przypadki to błędy lub błędy.
pytania
- Czy są jakieś problemy dotyczące ważności wykorzystania danych do oceny wcześniejszej?
- czy jakikolwiek konkretny test najlepiej nadaje się do tego problemu?
Przykłady
Oto dwa zestawy danych, które wcześniej były słabo dopasowane do ponieważ pochodzą one z populacji z (czerwony) lub (niebieski).
Niebieskie dane mogą być prawidłową kombinacją wcześniejszych danych + danych, podczas gdy czerwone dane wymagają wcześniejszego rozkładu obsługiwanego dla wartości ujemnych.
set.seed(1)
x<- seq(0.01,15,by=0.1)
plot(x, dlnorm(x), type = 'l', xlim = c(-15,15),xlab='',ylab='')
points(rnorm(50,0,5),jitter(rep(0,50),factor =0.2), cex = 0.3, col = 'red')
points(rnorm(50,8,0.5),jitter(rep(0,50),factor =0.4), cex = 0.3, col = 'blue')
źródło
Oto moje dwa centy:
Myślę, że powinieneś się martwić o wcześniejsze parametry związane ze stosunkami.
Mówisz o informacyjnym przeorze, ale myślę, że powinieneś ostrzec użytkowników o tym, czym jest rozsądny nieinformacyjny przeor. Mam na myśli, że czasami normalna z zerową średnią i wariancją 100 jest dość nieinformacyjna, a czasem ma charakter informacyjny, w zależności od zastosowanych skal. Na przykład, jeśli regresujesz wynagrodzenie na wysokościach (centymetrach), to powyższe informacje są dość pouczające. Jeśli jednak regresujesz dziennik płac na wysokościach (metrach), to powyższy przeor nie jest tak pouczający.
Jeśli korzystasz z uprzedniego, który jest wynikiem poprzedniej analizy, tj. Nowy uprzedni jest tak naprawdę starym posteriori z poprzedniej analizy, wtedy sprawy wyglądają inaczej. Zakładam, że tak jest w przypadku.
źródło