Wydaje się, że w społeczności bayesowskiej trwa debata na temat tego, czy powinniśmy przeprowadzać szacowanie parametrów bayesowskich czy testowanie hipotez bayesowskich. Jestem zainteresowany pozyskiwaniem opinii na ten temat. Jakie są względne mocne i słabe strony tych podejść? W jakich kontekstach jedno jest bardziej odpowiednie niż drugie? Czy powinniśmy przeprowadzać zarówno oszacowanie parametrów, jak i testowanie hipotez, czy tylko jedno?
hypothesis-testing
bayesian
sammosummo
źródło
źródło
Odpowiedzi:
W moim rozumieniu problem nie polega na sprzeciwie się oszacowaniu parametrów lub testowaniu hipotez, które rzeczywiście odpowiadają na różne pytania formalne, ale bardziej na temat tego, jak nauka powinna działać, a dokładniej, jakiego paradygmatu statystycznego powinniśmy użyć, aby odpowiedzieć na dane pytanie praktyczne.
większość czasu stosuje się testowanie hipotez: chcesz przetestować nowy lek, „jego działanie jest podobne do placebo”. Możesz jednak sformalizować go jako: „jaki jest zakres prawdopodobnego działania leku?” co prowadzi do wnioskowania, a szczególnie oszacowania interwału (hpd). To przenosi pierwotne pytanie w inny, ale może bardziej podatny na interpretację sposób. Kilku znanych statystów opowiada się za „takim” rozwiązaniem (np. Gelman patrz http://andrewgelman.com/2011/04/02/so-called_bayes/ lub http://andrewgelman.com/2014/09/05/confirmationist-falsificationist -paradigms-science / ).HO:
Bardziej rozbudowane aspekty wnioskowania bayesowskiego do takich celów testowych obejmują:
porównanie i sprawdzenie modelu, w którym model (lub modele konkurujące) można sfałszować na podstawie późniejszych kontroli predykcyjnych (np. http://www.stat.columbia.edu/~gelman/research/published/philosophy.pdf ).
testowanie hipotez za pomocą modelu szacowania mieszaniny https://arxiv.org/abs/1412.2044, w którym wnioskuje się o prawdopodobieństwie późniejszym związanym z zestawem możliwych wyjaśnionych hipotez.
źródło
W uzupełnieniu doskonałej odpowiedzi peuhp chcę dodać, że jedyną świadomą mi debatą jest to, czy testowanie hipotez powinno być częścią paradygmatu bayesowskiego. Ta debata trwa od dziesięcioleci i nie jest nowa. Argumenty przeciwko uzyskaniu ostatecznej odpowiedzi na pytanie „czy parametr w ramach podzbioru przestrzeni parametrów?”θ Θ0 lub na pytanie „czy model jest modelem za danymi?” M1 jest ich wiele i, moim zdaniem, wystarczająco przekonujących, aby je rozważyć. Na przykład w ostatnim artykule, jak wskazał peuhp, twierdzimy, że wybór modelu i testowanie hipotez można przeprowadzić za pomocą modelu mieszanki do osadzania, który można oszacować, a znaczenie każdego modelu lub hipotezy dla danych danych jest tłumaczone przez rozkład a posteriori na wadze mieszanki, który może być postrzegane jako „szacunek”.
Tradycyjna bayesowska procedura testowania hipotez polega na zwróceniu ostatecznej odpowiedzi na podstawie prawdopodobieństwa a posteriori wspomnianej hipotezy lub modelu. Jest to formalnie potwierdzone przez argument teorii decyzji przy użyciu funkcji straty Neymana-Pearsona , która karze wszystkie błędne decyzje tą samą stratą. Biorąc pod uwagę złożoność wyboru modelu i ustawienia testowania hipotez, uważam, że ta funkcja strat jest zbyt podstawowa, aby była przekonująca.0−1
Po przeczytaniu artykułu Kruschke wydaje mi się, że sprzeciwia się podejściu opartemu na regionach HPD do użycia czynnika Bayesa, co brzmi jak bayesowski odpowiednik częstego sprzeciwu między procedurami testowymi Neymanna-Pearsona i odwracaniem przedziałów ufności.
źródło
Jak powiedzieli poprzedni respondenci, testy hipotez (bayesowskie) i (bayesowskie) szacowanie parametrów ciągłych dostarczają różnych informacji w odpowiedzi na różne pytania. Może się zdarzyć, że badacz naprawdę potrzebuje odpowiedzi na test hipotezy zerowej. W tym przypadku bardzo przydatny może być starannie przeprowadzony test hipotezy bayesowskiej (wykorzystujący rzetelnie poinformowane, niebędące domyślnymi priory). Ale zbyt często testy hipotezy zerowej są „bezmyślnymi rytuałami” (Gigerenzer i in.) I ułatwiają analitykowi popadnięcie w błędne „czarno-białe” myślenie o obecności lub braku efektów. Preprint w OSF zapewnia rozszerzoną dyskusję Bayesa częstościowym i podejść do testowania hipotez i szacowania niepewności z tym, zorganizowanej wokół stołu: Przedruk można znaleźć tutaj: https://osf.io/dktc5/
źródło