Zapytano o to również w Computational Science.
Próbuję obliczyć bayesowskie oszacowanie niektórych współczynników dla autoregresji, z 11 próbkami danych: gdzie jest Gaussa ze średnią 0 i wariancją Wcześniejszy rozkład na wektorze jest Gaussa ze średnią i ukośną macierzą kowariancji z wpisy ukośne równe .
W oparciu o formułę autoregresji oznacza to, że rozkład punktów danych ( ) jest normalny ze średnią i wariancją . Tak więc gęstość wszystkich punktów danych łącznie (przy założeniu niezależności, co jest w porządku dla programu, który piszę), będzie wynosić:
Twierdzeniem Bayesa możemy wziąć iloczyn powyższej gęstości z wcześniejszą gęstością, a wtedy potrzebujemy tylko stałej normalizującej. Mam przeczucie, że powinno to działać jako rozkład Gaussa, więc możemy się martwić o stałą normalizującą na końcu, zamiast jawnie obliczać ją za pomocą całek względem i .
Z tą częścią mam problem. Jak obliczyć mnożenie wcześniejszej gęstości (która jest wielowymiarowa) i iloczynu gęstości danych jednowymiarowych? Tylny musi mieć czystą gęstość i , ale nie widzę, jak można to uzyskać z takiego produktu.
Wszelkie wskazówki są naprawdę pomocne, nawet jeśli po prostu skierujesz mnie we właściwym kierunku, a następnie muszę iść i zrobić bałaganiarską algebrę (co próbowałem już kilka razy).
Na początek jest postać licznika z reguły Bayesa:
Problem polega na tym, jak zobaczyć, że zmniejsza się to do gęstości Gaussa .
Dodany
Ostatecznie sprowadza się to do następującego ogólnego problemu. Jeśli otrzymasz jakieś wyrażenie kwadratowe, takie jak jak to ująć w formę kwadratową dla niektórych macierzy 2x2 ? W prostych przypadkach jest to dość proste, ale jakiego procesu używasz, aby uzyskać średnie oszacowania, i ?
Uwaga: wypróbowałem prostą opcję rozszerzenia formuły macierzowej, a następnie próbowałem zrównać współczynniki jak powyżej. Problem w moim przypadku polega na tym, że stała wynosi zero, a następnie otrzymuję trzy równania w dwóch niewiadomych, więc niedokładne jest jedynie dopasowanie współczynników (nawet jeśli założę symetryczną macierz kwadratową).
Odpowiedzi:
Wskazówka, która znajdowała się w mojej odpowiedzi na poprzednią odpowiedź, to przyjrzeć się temu, jak zintegrowałem parametry - ponieważ zrobisz tutaj dokładnie te same całki. Pytanie zakłada, że parametry wariancji są znane, więc są one stałymi. Wystarczy spojrzeć na zależność od licznika. Aby to zobaczyć, zauważ, że możemy napisać:α,μ
Zauważ, można przesunąć pierwszy współczynnik się podwójnej całki na mianowniku, i kasuje się z licznikiem. Możemy również pobrać sumę kwadratów a także anuluje. Całka, z jaką mamy teraz, jest (po rozszerzeniu kwadratu):1(2πσ2e)5⋅2πσ2p exp[−12σ2e∑11i=2Y2i]
Teraz możemy użyć ogólnego wyniku z normalnego pliku pdf.
Daj mi znać, jeśli potrzebujesz więcej wskazówek.
aktualizacja
(uwaga: poprawna formuła powinna wynosić zamiast )10μ2 μ2
jeśli spojrzymy na kwadratową formę, którą napisaliście w aktualizacji, zauważymy, że istnieje współczynników ( ma znaczenia dla a posteriori, ponieważ zawsze możemy dodać dowolną stałą, która anuluje w mianowniku). Mamy też niewiadomych . Jest to zatem „dobrze postawiony” problem, o ile równania są liniowo niezależne. Jeśli rozwiniemy kwadratowy otrzymujemy:5 L 5 μ^,α^,Q11,Q12=Q21,Q22 (μ−μ^,α−α^)Q(μ−μ^,α−α^)t
Porównując współczynnik drugiego rzędu, otrzymujemy co mówi nam, jak wygląda (odwrotna) macierz kowariancji. Również dwie nieznacznie bardziej skomplikowane równania dla po podstawieniu do . Można je zapisać w postaci macierzy jako:A=Q11,B=2Q12,C=Q22 α^,μ^ Q
Tak więc szacunki są podane przez:
Pokazuje, że nie mamy unikalnych szacunków, chyba że . Teraz mamy:4AC≠B2
Zauważ, że jeśli zdefiniujemy dla i przyjmiemy limit wówczas szacunki dla są podane przez zwykłe najmniejsze kwadraty oszacowanie i gdzie i . Tak więc szacunki tylne są średnią ważoną między szacunkami OLS a wcześniejszymi szacunkami .Xi=Yi−1 i=2,…,11 σ2p→∞ μ,α α^=∑11i=2(Yi−Y¯¯¯¯)(Xi−X¯¯¯¯¯)∑11i=2(Xi−X¯¯¯¯¯)2 μ^=Y¯¯¯¯−α^X¯¯¯¯ Y¯¯¯¯=110∑11i=2Yi X¯¯¯¯=110∑11i=2Xi=110∑10i=1Yi (0,0)
źródło