Jeffreys przed wieloma parametrami

14

W niektórych przypadkach wcześniejszy Jeffreys dla pełnego modelu wielowymiarowego jest ogólnie uważany za nieodpowiedni, tak jest na przykład w przypadku: (gdzie , przy nieznanych i ), gdzie preferowany jest następujący przeor (do pełnego Jeffreys ): gdzie to wcześniejszy Jeffreys uzyskany przy zachowaniu stałej \ sigma (i podobnie dla p ( \ sigma) ). To przeżycie pokrywa się z referencyjnym przełożeniem podczas leczenia sigmaε N ( 0 , σ 2 ) μ σ π ( μ , σ ) σ - 2 p ( μ , σ ) = π ( μ ) π ( σ ) σ - 1

yi=μ+εi,
εN(0,σ2)μσπ(μ,σ)σ2π ( μ ) σ p ( σ ) σ
p(μ,σ)=π(μ)π(σ)σ1,
π(μ)σp(σ)σi μ w osobnych grupach.

Pytanie 1: Dlaczego traktowanie ich jak w oddzielnych grupach ma większy sens niż traktowanie ich w tej samej grupie (co spowoduje, jeśli mam rację (?), W pełnowymiarowym przed Jeffreys, patrz [1])?


Następnie rozważ następującą sytuację:

yi=g(xi,θ)+εi,
gdzie θRn jest nieznany, εiN(0,σ2) , σ jest nieznane, a g jest znaną funkcją nieliniową. W takim przypadku kuszące i z mojego doświadczenia czasami owocne jest rozważenie następującego rozkładu:
p(σ,θ)=π(σ)π(θ),
gdzie π(σ) i π(θ) są pierwszymi Jeffreysami dla dwóch podmodeli, tak jak w przykładzie lokalizacji poprzedniej skali.

Pytanie 2: Czy w takiej sytuacji możemy powiedzieć coś o optymalności (z perspektywy teorii informacji) pochodnego wcześniejszego ?p(σ,θ)


[1] From https://theses.lib.vt.edu/theses/available/etd-042299-095037/unrestricted/etd.pdf :

Na koniec zauważamy, że przeor Jeffreysa jest szczególnym przypadkiem przeora referencyjnego. W szczególności wcześniejszy Jeffreys odpowiada referencji, w której wszystkie parametry modelu są traktowane w jednej grupie.

peuhp
źródło
2
Myślę, że masz na myśli model wielowymiarowy, regresja wielowymiarowa jest ściśle zarezerwowana dla wielu zmiennych po lewej stronie.
mdewey

Odpowiedzi:

2

Co jest optymalne? Nie ma ogólnego i ogólnego wyniku „optymalności” dla wcześniejszego Jeffreysa. Wszystko zależy od celu analizy statystycznej i funkcji strat przyjętej do oceny i porównania procedur. W przeciwnym razie nie można porównać z . Jak napisałem w mojej najpopularniejszej odpowiedzi na temat sprawdzonego X , nie ma czegoś takiego jak najlepszy nieinformacyjny przeor.π(θ,σ)1σπ(θ,σ)1σ2

Xi'an
źródło
1
Dziękujemy za wkład. Niemniej jednak, moim zdaniem, Jeffreys wcześniej oferuje pewną optymalizację w tym sensie, że przynajmniej w ustawieniu 1d to one minimalizują teoretyczną ilość informacji, która może mieć sens i zostać przedyskutowana (daj mi znać, jeśli się mylę) ). Chodzi mi o to: czy możemy napisać podobne „kryterium”, wcześniejsza procedura Jeffreysa spełnia dwa ustawienia podane w moim pytaniu? Z cytatu podanego w moim pytaniu wydaje się, że tak i chętnie omówię konsekwencje wyboru tego kryterium zamiast innego (z czysto informatycznego punktu widzenia :)).
peuhp