W książce Gelman & Hill (2007) (Analiza danych przy użyciu regresji i modeli wielopoziomowych / hierarchicznych) autorzy twierdzą, że uwzględnienie redundantnych parametrów średnich może przyspieszyć MCMC.
Podany przykład jest nie zagnieżdżonym modelem „symulatora lotu” (równanie 13.9):
Zalecają ponowną parametryzację, dodając średnie parametry i w następujący sposób:μ δ
Jedynym uzasadnieniem jest to, że (s. 420):
Symulacje mogą utknąć w konfiguracji, w której cały wektor (lub ) jest daleki od zera (nawet jeśli przypisano im rozkład ze średnią 0). Ostatecznie symulacje zbiegną się w prawidłowy rozkład, ale nie chcemy czekać.δ
W jaki sposób nadmiarowe średnie parametry pomagają rozwiązać ten problem?
Wydaje mi się, że model nie zagnieżdżony jest powolny głównie z powodu ujemnej korelacji i . (Rzeczywiście, jeśli jeden wzrośnie, drugi musi spaść, biorąc pod uwagę, że ich suma jest „ustalona” przez dane). Czy nadmiarowe średnie parametry pomagają w zmniejszeniu korelacji między i , czy czymś zupełnie innym?δ γ δ
źródło
Odpowiedzi:
Korelacji, której należy unikać, jest ta między a i .γ j δ kμ γj δk
Zastąpienie i w modelu obliczeniowym alternatywnymi parametrami, które skupiają się wokół zmniejsza korelację.δ k μγj δk μ
Zobacz bardzo jasny opis w sekcji 25.1 „Co to jest hierarchiczne centrowanie?” w (ogólnodostępnej) książce „Szacowanie MCMC w MLwiN” Williama J. Browne'a i innych. http://www.bristol.ac.uk/cmm/software/mlwin/download/manuals.html
źródło