Łączenie dwóch macierzy kowariancji

11

Obliczam kowariancję rozkładu równolegle i muszę połączyć wyniki rozproszone w liczbie pojedynczej Gaussa. Jak połączyć te dwa elementy?

Interpolacja liniowa między tymi dwoma prawie działa, jeśli są one podobnie rozmieszczone i zwymiarowane.

Wikipedia zapewnia forumla na dole dla kombinacji, ale wydaje się to niewłaściwe; dwie identycznie rozmieszczone dystrybucje powinny mieć tę samą kowariancję, ale wzór na dole strony podwaja kowariancję.

Czy istnieje sposób na połączenie dwóch macierzy?

Matt Kemp
źródło
3
Formuła Wikipedii odpowiada na twoje pytanie, Matt: być może nie zauważyłeś, że jest to formuła częściowa, w której następnie musisz podzielić przez wielkość próby.
whuber
1
Zrozumiałem to teraz, z twoją pomocą - jeśli umieścisz to w odpowiedzi, zaznaczę to jako odpowiedź.
Matt Kemp,

Odpowiedzi:

12

To pytanie pojawia się na wiele sposobów. To, co jest dla nich wspólne, to

Jak połączyć statystyki oparte na momentach, które zostały obliczone z rozłącznych podzbiorów moich danych?

Najprostsza aplikacja dotyczy danych, które zostały podzielone na dwie grupy. Wiesz rozmiary grupy i grupa oznacza. Jeśli chodzi o same te cztery wielkości, jaki jest ogólny średni poziom danych?

Inne aplikacje generalizują od średnich do odchyleń, odchyleń standardowych, macierzy kowariancji, krzywizny i statystyki wielowymiarowej; i może obejmować wiele podgrup danych. Zauważ, że wiele z tych wielkości jest nieco skomplikowanymi kombinacjami momentów: na przykład odchylenie standardowe jest pierwiastkiem kwadratowym kwadratowej kombinacji pierwszej i drugiej chwili (średnia i średnia kwadratowa).

X=(x1,x2,,xn)j1,j2,,jg(x1,x2,,xj1;xj1+1,,xj1+j2;xj1+j2+1,;;,xn)iX(i)=(xji+1,xji+2,,xji+1)ky1,,yjk

μk(y)=(y1k+y2k++yjk)/j.

jμk(y)kgn

nμk(X)=(x1k+x2k++xnk)=(x1k+x2k++xj1k)++(xj1++jg1+1k+xj1++jg1+2k++xnk)=j1μk(X(1))+j2μk(X(2))++jgμk(X(g)).

nkk

xy

((x1,y1),(x2,y2),,(xn,yn)),

gxiyi(1,1)μ(1,1)n

n1nn1ji1nji


n

Whuber
źródło
Jestem trochę zdezorientowany definicją k-tego momentu. Czy zakładasz zero średnich danych?
reschu
kth
May Bad! Mieszałem momenty „centralny” i „surowy”. Dzięki za wyjaśnienie!
reschu
Myślę, że „aby poznać średnie wielkości podgrup” w przedostatnim akapicie należy przeczytać „znać średnie podgrup” zamiast tego? (
Waham się, czy sami
@Juho Masz całkowitą rację. Dziękujemy za zauważenie tego!
whuber