Diagnostyka konwergencji Gelmana i Rubina, jak uogólnić do pracy z wektorami?

14

Diagnostyka Gelmana i Rubina służy do sprawdzania zbieżności wielu równoległych łańcuchów mcmc. Porównuje wariancję wewnątrz łańcucha z wariancją między łańcuchem, opis poniżej:

Kroki (dla każdego parametru):

  1. Poprowadź m ≥ 2 łańcuchy o długości 2n od nadmiernie rozproszonych wartości początkowych.
  2. Odrzuć pierwsze n losowań w każdym łańcuchu.
  3. Oblicz wariancję wewnątrz łańcucha i między łańcuchem.
  4. Oblicz szacunkową wariancję parametru jako ważoną sumę wariancji wewnątrz łańcucha i między łańcuchem.
  5. Oblicz potencjalny współczynnik redukcji skali.
  6. Element listy

Chcę użyć tej statystyki, ale zmienne, których chcę użyć, to losowe wektory.

Czy w tym przypadku sensowne jest zastosowanie średniej macierzy kowariancji?

Tim
źródło

Odpowiedzi:

17

Zalecenie: wystarczy obliczyć PSRF osobno dla każdego składnika skalarnego

Oryginalny artykuł Gelmana i Rubina [1], a także podręcznik analizy danych bayesowskich Gelmana i in. [2] zaleca obliczenie potencjalnego współczynnika redukcji skali (PSRF) osobno dla każdego interesującego parametru skalarnego. Aby wydedukować zbieżność, wymagane jest, aby wszystkie PSRF były bliskie 1. Nie ma znaczenia, że ​​twoje parametry są interpretowane jako wektory losowe, ich komponenty są skalarami, dla których możesz obliczyć PSRF.

Brooks i Gelman [3] zaproponowali wielowymiarowe rozszerzenie PSRF, które omówię w następnej części tej odpowiedzi. Cytując jednak Gelmana i Shirleya [4]:

[...] metody te mogą czasami oznaczać przesadę: poszczególne parametry można dobrze oszacować, nawet jeśli przybliżona zbieżność symulacji rozkładu wielowymiarowego może zająć bardzo dużo czasu.

Alternatywnie: rozszerzenie wielu odmian przez Brooks & Gelman

Brooks i Gelman [3] proponują wielowymiarowe rozszerzenie PSRF, w którym faktycznie oblicza się macierz szacowanej kowariancji (twój krok 4) jako ważoną sumę macierzy kowariancji wewnątrz łańcucha ( ) i między łańcuchem ( B ) etap 3): V = n - 1W.b

V.^=n-1nW.+1nb,
nV.^,W.
R^=maxzazaT.V.^zazaT.W.za=n-1n+(m+1m)λ1,
mλ1W.-1V.^/nλ10nR^

Bibliografia

[1] Gelman, Andrew i Donald B. Rubin. „Wnioskowanie z iteracyjnej symulacji przy użyciu wielu sekwencji.” Statistics Science (1992): 457-472.

[2] Gelman, Andrew i in. Analiza danych bayesowskich. Prasa CRC, 2013.

[3] Brooks, Stephen P. i Andrew Gelman. „Ogólne metody monitorowania konwergencji iteracyjnych symulacji”. Journal of Computational and Graphical Statistics 7.4 (1998): 434-455.

[4] Gelman, Andrew i Kenneth Shirley. „Wnioski z symulacji i monitorowania konwergencji”. (Rozdział 6 w Brooks, Steve i in., Red., Handbook of Markov Chain Monte Carlo. CRC Press, 2011.)

Wszystkie artykuły z wyjątkiem podręcznika [2] są dostępne na stronie Andrew Gelmana .

Juho Kokkala
źródło