Jestem zdezorientowany, jak ocenić tylny rozkład predykcyjny dla regresji liniowej Bayesa, pomijając podstawowy przypadek opisany tutaj na stronie 3, i skopiowałem poniżej.
Podstawowym przypadkiem jest ten model regresji liniowej:
Jeśli użyjemy albo munduru przed , ze skalą Inv przed , LUB normalnego-odwrotnego-gamma przed (patrz tutaj ), tylna dystrybucja predykcyjna jest analityczna i jest studentem.
Co z tym modelem?
Kiedy , ale jest znane, tylny rozkład predykcyjny jest wielowymiarowy Gaussa. Zwykle nie znasz , ale musisz to oszacować. Może powiesz, że jest przekątna, i uczynisz ją w jakiś sposób funkcją zmiennych towarzyszących. Jest to omówione w rozdziale dotyczącym regresji liniowej w analizie danych bayesowskich Gelmana .
Czy w tym przypadku istnieje forma analityczna dla tylnego rozkładu predykcyjnego? Czy mogę po prostu podłączyć swoją ocenę tego do wielowymiarowego ucznia t? Jeśli oszacujesz więcej niż jedną wariancję, czy rozkład nadal jest wielowymiarowy dla studenta t?
Pytam, bo powiedz, że mam już trochę . Chcę wiedzieć, czy jest bardziej prawdopodobne, że można to przewidzieć np. Przez regresję liniową A, regresję liniową B.
Odpowiedzi:
Jeśli założysz mundur przed , to tylna dla to with Aby znaleźć rozkład predykcyjny, potrzebujemy więcej informacji. Jeśli i jest warunkowo niezależny od dającego , to Ale zazwyczaj dla tego typu modeli i nie są warunkowo niezależne, zamiast tego zazwyczaj mamyβ β
źródło
W przypadku nieinformacyjnych lub wielowymiarowych priorów normalnego życzenia, masz formę analityczną jako wielowymiarowy rozkład Studenta, dla klasycznej wielowariantowej, regresji wielokrotnej. Myślę, że zmiany w tym dokumencie są związane z twoim pytaniem (może ci się spodobać załącznik A :-)). Zazwyczaj porównywałem wynik z późniejszym rozkładem predykcyjnym uzyskanym za pomocą WinBUGS i formą analityczną: są one dokładnie równoważne. Problem staje się trudny tylko wtedy, gdy masz dodatkowe efekty losowe w modelach z efektami mieszanymi, szczególnie w przypadku niezrównoważonego projektu.
Ogólnie, przy klasycznych regresjach, yi ỹ są warunkowo niezależne (reszty są iid)! Oczywiście, jeśli tak nie jest, proponowane tutaj rozwiązanie jest nieprawidłowe.
W R (tutaj rozwiązanie dla jednolitych priorytetów), zakładając, że wykonałeś model lm (o nazwie „model”) jednej z odpowiedzi w swoim modelu i nazwałeś go „modelem”, oto jak uzyskać wielowymiarowy rozkład predykcyjny
Teraz kwantyle ysim są przedziałami tolerancji oczekiwań beta od rozkładu predykcyjnego, możesz oczywiście bezpośrednio użyć próbkowanego rozkładu, aby zrobić co chcesz.
źródło