Szacowanie parametrów bayesowskich czy testowanie hipotez bayesowskich?

11

Wydaje się, że w społeczności bayesowskiej trwa debata na temat tego, czy powinniśmy przeprowadzać szacowanie parametrów bayesowskich czy testowanie hipotez bayesowskich. Jestem zainteresowany pozyskiwaniem opinii na ten temat. Jakie są względne mocne i słabe strony tych podejść? W jakich kontekstach jedno jest bardziej odpowiednie niż drugie? Czy powinniśmy przeprowadzać zarówno oszacowanie parametrów, jak i testowanie hipotez, czy tylko jedno?

sammosummo
źródło
1
Szacowanie parametrów i testowanie hipotez to różne rzeczy. Nigdy nie słyszałem o takiej debacie i nie wiem, o co by to było? To tak, jakbyś zapytał, czy lepiej zjeść obiad, czy zamiast tego popływać.
Tim
1
Nie, on nie wysuwa takiego argumentu. Pokazuje, jak oszacować test t-bayesowski. Jeśli potrzebujesz oszacować parametr, musisz oszacować parametr, jeśli musisz przetestować hipotezę, musisz przetestować hipotezę, nie używasz ich zamiennie.
Tim
1
Artykuł nazywa się „estymacja Bayesa zastępuje test t”. „Zastąpić” oznacza „zamiast”. Ergo, użyj testu Bayesa zamiast w miejscu testu (zamiast).
sammosummo,
2
@sammosummo Czy myślisz o czymś takim jak ten artykuł Kruschke ?
Ian_Fin
1
@Ian_Fin Tak, właśnie o tym myślałem, dziękuję. Powinienem był sprawdzić inne publikacje Kruschke! Wiem, że on, podobnie jak Andrew Gelman, zdecydowanie popiera szacunek i pomyślał, że mogę uzyskać bardziej wyważone argumenty od Cross Validated.
sammosummo,

Odpowiedzi:

9

W moim rozumieniu problem nie polega na sprzeciwie się oszacowaniu parametrów lub testowaniu hipotez, które rzeczywiście odpowiadają na różne pytania formalne, ale bardziej na temat tego, jak nauka powinna działać, a dokładniej, jakiego paradygmatu statystycznego powinniśmy użyć, aby odpowiedzieć na dane pytanie praktyczne.

większość czasu stosuje się testowanie hipotez: chcesz przetestować nowy lek, „jego działanie jest podobne do placebo”. Możesz jednak sformalizować go jako: „jaki jest zakres prawdopodobnego działania leku?” co prowadzi do wnioskowania, a szczególnie oszacowania interwału (hpd). To przenosi pierwotne pytanie w inny, ale może bardziej podatny na interpretację sposób. Kilku znanych statystów opowiada się za „takim” rozwiązaniem (np. Gelman patrz http://andrewgelman.com/2011/04/02/so-called_bayes/ lub http://andrewgelman.com/2014/09/05/confirmationist-falsificationist -paradigms-science / ).HO:

Bardziej rozbudowane aspekty wnioskowania bayesowskiego do takich celów testowych obejmują:

peuhp
źródło
1
(+1) Dziękujemy za połączenie z naszym referatem! Zastanawiałem się, czy wspomnieć o tym aspekcie ...
Xi'an,
1
+1, ale może warto dodać linki do osób (w przeciwieństwie do Gelmana), które opowiadają się przeciwko szacunkom bayesowskim i na rzecz testowania hipotez bayesowskich. Mam kilka linków w mojej odpowiedzi na stats.stackexchange.com/questions/200500 . EJ Wagenmakers to chyba jedna osoba, która bardzo przebywa w bayesowskim obozie testowym. Zobacz, dlaczego testy hipotez są niezbędne w naukach psychologicznych: komentarz do Cumminga i być może jego innych prac.
ameba
Znalazłem twoją odpowiedź na poprzednie pytanie, zanim zadałem to pytanie. To doskonała odpowiedź (i doskonałe pytanie) i oba całkowicie zastępują moje.
sammosummo,
Myślę, że peuhp oznaczało „sławnych statystyk”, a nie „notorycznych statystyk”. Ale może nie! :-) W każdym razie, jeśli ludzie podążą za linkiem peuhp do późniejszej kontroli predykcyjnej zalecanej przez Gelmana i Shalizi, wówczas ludzie powinni również rozważyć komentarze do tego artykułu, z których jeden jest tutaj: indiana.edu/~kruschke/articles/Kruschke2013BJMSP.pdf
John K. Kruschke,
8

W uzupełnieniu doskonałej odpowiedzi peuhp chcę dodać, że jedyną świadomą mi debatą jest to, czy testowanie hipotez powinno być częścią paradygmatu bayesowskiego. Ta debata trwa od dziesięcioleci i nie jest nowa. Argumenty przeciwko uzyskaniu ostatecznej odpowiedzi na pytanie „czy parametr w ramach podzbioru przestrzeni parametrów?” θΘ0lub na pytanie „czy model jest modelem za danymi?” M1jest ich wiele i, moim zdaniem, wystarczająco przekonujących, aby je rozważyć. Na przykład w ostatnim artykule, jak wskazał peuhp, twierdzimy, że wybór modelu i testowanie hipotez można przeprowadzić za pomocą modelu mieszanki do osadzania, który można oszacować, a znaczenie każdego modelu lub hipotezy dla danych danych jest tłumaczone przez rozkład a posteriori na wadze mieszanki, który może być postrzegane jako „szacunek”.

Tradycyjna bayesowska procedura testowania hipotez polega na zwróceniu ostatecznej odpowiedzi na podstawie prawdopodobieństwa a posteriori wspomnianej hipotezy lub modelu. Jest to formalnie potwierdzone przez argument teorii decyzji przy użyciu funkcji straty Neymana-Pearsona , która karze wszystkie błędne decyzje tą samą stratą. Biorąc pod uwagę złożoność wyboru modelu i ustawienia testowania hipotez, uważam, że ta funkcja strat jest zbyt podstawowa, aby była przekonująca.01

Po przeczytaniu artykułu Kruschke wydaje mi się, że sprzeciwia się podejściu opartemu na regionach HPD do użycia czynnika Bayesa, co brzmi jak bayesowski odpowiednik częstego sprzeciwu między procedurami testowymi Neymanna-Pearsona i odwracaniem przedziałów ufności.

Xi'an
źródło
Zobacz wyjaśnienie na dobayesiandataanalysis.blogspot.com/2016/12/...
John K. Kruschke,
3

Jak powiedzieli poprzedni respondenci, testy hipotez (bayesowskie) i (bayesowskie) szacowanie parametrów ciągłych dostarczają różnych informacji w odpowiedzi na różne pytania. Może się zdarzyć, że badacz naprawdę potrzebuje odpowiedzi na test hipotezy zerowej. W tym przypadku bardzo przydatny może być starannie przeprowadzony test hipotezy bayesowskiej (wykorzystujący rzetelnie poinformowane, niebędące domyślnymi priory). Ale zbyt często testy hipotezy zerowej są „bezmyślnymi rytuałami” (Gigerenzer i in.) I ułatwiają analitykowi popadnięcie w błędne „czarno-białe” myślenie o obecności lub braku efektów. Preprint w OSF zapewnia rozszerzoną dyskusję Bayesa częstościowym i podejść do testowania hipotez i szacowania niepewności z tym, zorganizowanej wokół stołu: wprowadź opis zdjęcia tutaj Przedruk można znaleźć tutaj: https://osf.io/dktc5/

John K. Kruschke
źródło