Brakujące wartości w zmiennej odpowiedzi w JAGS

10

Gelman i Hill (2006) mówią:

W Bugs brakujące wyniki w regresji można łatwo rozwiązać, po prostu włączając wektor danych, NA i wszystkie. Błędy jawnie modelują zmienną wynikową, dlatego użycie tego modelu jest banalne, aby w efekcie przypisywać brakujące wartości przy każdej iteracji.

Brzmi to jak prosty sposób na wykorzystanie JAGS do przewidywania. Ale czy obserwacje z brakującymi wynikami mają również wpływ na oszacowania parametrów? Jeśli tak, to czy istnieje prosty sposób, aby zachować te obserwacje w zbiorze danych, który widzi JAGS, ale nie wpływać na oszacowania parametrów? Myślałem o funkcji cięcia, ale jest ona dostępna tylko w BŁĘDACH, a nie w JAGS.

Jack Tanner
źródło

Odpowiedzi:

11

Tak, jest naprawdę łatwy w użyciu w BŁĘDACH lub JAGACH! Korzystanie z niego jest przyjemnością!

Ale czy obserwacje z brakującymi wynikami mają również wpływ na oszacowania parametrów?

Oczywiście nie. Na parametry mają wpływ tylko obserwowane wyniki. Brakujące wyniki (NA) nie wpłyną na nic, w rzeczywistości jest na odwrót: brakujące wyniki zostaną wyprowadzone z parametrów. Zauważ, że brakujące wyniki będą miały również swój rozkład tylny. Wówczas bardzo łatwo jest obliczyć niektóre wielkości pochodne, np. Sumę nad wskaźnikami wyniku, i te wielkości pochodne są obsługiwane nie tylko w przypadku brakujących wartości, ale także mają natychmiastowy ich rozkład boczny. To jest takie seksowne w BUGS & JAGS!

Baw się dobrze!

Ciekawy
źródło
1
Niestety nie jestem przekonany, że brakujące wyniki nie wpływają na oszacowanie parametrów. Jackman wydaje się mówić odwrotnie: jackman.stanford.edu/blog/?p=38
Jack Tanner
@JackTanner, zastanów się chwilę. Jak brak wartości może wpłynąć na coś? Wraz z uruchomieniem algorytmu brakująca wartość zacznie być przypisywana szacunkom parametrów (są one uzyskiwane z zaobserwowanych wyników). Następnie (być może nie jestem pewien), informacje z przypisanego brakującego wyniku mogą wrócić do parametrów, ale to nie ma znaczenia - to tylko oryginalne informacje, obecne w parametrach, wróciły do ​​nich. PRAWDZIWE informacje, które mają wpływ na coś, pochodzą wyłącznie z PRAWDZIWYCH wyników. Jeśli mi nie ufasz, wykonaj symulację, porównaj wyniki i opublikuj tutaj.
Ciekawy
Jeśli chodzi o twój link, najwyraźniej nie jest tego pewien, mówi „problem” - w cudzysłowie i mówi „byłoby interesujące porównać”. Mówię, że nie będzie znaczącej różnicy. Jeśli chcesz to przetestować, śmiało.
Ciekawy
3
Zgadzam się; bez znaczącej różnicy. Używam tego podejścia do konstruowania tylnych rozkładów predykcyjnych; wystarczy umieścić wartości predykcyjne zmiennych po prawej stronie wraz z wartościami z przeszłości, a NA dla zmiennej docelowej „obserwacje” odpowiadające wartościom predykcyjnym.
jbowman
@jbowman, tak, dobra uwaga! Nie jest to oczywisty pomysł na przewidywanie w ten sposób!
Ciekawy