Czy rozkłady próbkowania są uzasadnione do wnioskowania?

15

Niektórzy Bayesianie atakują wnioskowanie częstych stwierdzając, że „nie ma unikalnego rozkładu próbkowania”, ponieważ zależy to od intencji badacza (Kruschke, Aguinis i Joo, 2012, s. 733).

Powiedzmy na przykład, że badacz rozpoczyna zbieranie danych, ale jego finansowanie zostało niespodziewanie zmniejszone po 40 uczestnikach. W jaki sposób zdefiniowano by tutaj rozkłady próbkowania (oraz kolejne CI i wartości p)? Czy po prostu zakładalibyśmy, że każda próbka składowa ma N = 40? A może składałby się z próbek o innym N, przy czym każdy rozmiar byłby określony przez inne losowe czasy, w których jego finansowanie mogło zostać zmniejszone?

Rozkłady t, F, chi-kwadrat (itp.), Zerowe znalezione w podręcznikach zakładają, że N jest stały i stały dla wszystkich składowych próbek, ale w praktyce może to nie być prawdą. Przy każdej innej procedurze zatrzymywania (np. Po pewnym okresie czasu lub do czasu, aż mój asystent się zmęczy) wydaje się, że istnieje inny rozkład próbkowania, a stosowanie tych „wypróbowanych i prawdziwych” stałych rozkładów N jest niewłaściwe.

Jak szkodliwa jest ta krytyka zasadności częstych CI i wartości p? Czy istnieją teoretyczne obalenia? Wydaje się, że atakując pojęcie rozkładu próbkowania, cały gmach częstych wnioskowania jest wątły.

Wszelkie odniesienia naukowe są mile widziane.

ATJ
źródło
1
Cytowanie dotyczy: Kruschke, JK, Aguinis, H., i Joo, H. (2012). Nadszedł czas: Bayesowskie metody analizy danych w naukach organizacyjnych. Ale Kruschke używał go już wcześniej w: (2010) analizie danych bayesowskich i (2010) W co wierzyć: bayesowskie metody analizy danych.
ATJ

Odpowiedzi:

21

n

n

xnx¯kμ=0μ0L.(0)L.(x¯)mi-k2)/2)kKadane (1996), „Uzasadnienie do przesądzonego wniosku”, JASA , 91 , 435

Wskazanie na zależność częstego wnioskowania od intencji badacza jest przydatnym wykopaliskiem dla ludzi (jeśli nadal są tacy), którzy zaczynają na wysokim koniu na temat „subiektywności” wnioskowania bayesowskiego. Osobiście mogę z tym żyć; wykonanie procedury w ciągu długiej serii powtórzeń zawsze będzie czymś mniej lub bardziej hipotetycznym, co nie umniejsza jej użyteczności („kalibracja prawdopodobieństwa” była sposobem, w jaki Cox opisał wartości p ). Od dat referencji mogłeś zauważyć, że te problemy nie są nowe; próby rozstrzygnięcia ich za pomocą argumentacji a priori w dużej mierze ucichły (z wyjątkiem Internetu, zawsze z opóźnieniem, z wyjątkiem błahych spraw)

PS: Myśląc o dodaniu przeciwwagi do Bergera i Wolperta, natknąłem się na Coxa i Mayo (2010), „Obiektywność i warunkowość w częstym wnioskowaniu” w Błędzie i wnioskowaniu . Prawdopodobnie w moim twierdzeniu, że debata wygasła, jest element myślenia życzeniowego, ale uderzające jest to, jak niewiele można powiedzieć na ten temat po około pół wieku. (Mimo wszystko jest to zwięzła i elokwentna obrona idei częstych.)

Scortchi - Przywróć Monikę
źródło
1
+1 (dawno temu). Zastanawiam się, czy rozumowanie Armitage'a można zaadaptować do dobrze znanego przykładu próbkowania dwumianowego i ujemnego; np. obserwowanie sekwencji rzutów monet TTTTTH daje albo p = 0,03, albo p = 0,1, w zależności od reguły zatrzymania. Jeśli więc rozważymy teraz jeszcze jedną zasadę zatrzymania, np. „Kontynuuj podrzucanie, aż dwumianowy p <0,05 i będzie co najmniej jeden H i co najmniej jeden T”, wówczas staje się raczej intuicyjne, że raczej nie należy ignorować tej reguły zatrzymywania dla wnioskowania (pomimo naruszenia zasady wiarygodności). Czy to ma sens?
ameba mówi Przywróć Monikę
4

Krótka odpowiedź na twoje pytanie brzmi: zależy od tego, kogo zapytasz ;-) Zagorzali Bayesianie ogłoszą zwycięstwo nad, lub przynajmniej równe z metodologią częstokroć. Zagorzali często odwiedzający przyjmą domyślnie opcję „Nie można odpowiedzieć”. Pozostałe 99% statystyk użyje wszelkich metod, które okazały się wiarygodne w przypadku przerwanych eksperymentów.

Wiem, że wrażliwość rozkładu próbkowania na intencje badacza może być niepokojąca i naprawdę nie ma dobrego rozwiązania tego problemu. Zarówno Bayesianie, jak i osoby często jeżdżące, muszą użyć pewnej subiektywności i osądu, decydując, jak sformułować wniosek. Myślę jednak, że bierzesz przykład z dziedziny, która jest ogólnie kontrowersyjna, i stawiasz problemy wyłącznie u stóp częstego wnioskowania. Sekwencyjne i / lub zatrzymane eksperymenty są klasycznymi przykładami subiektywnej natury wnioskowania ... i na które nie ma absolutnie obiektywnych i uzgodnionych odpowiedzi.

Co powiesz na regularne wnioskowanie, w którym rzeczywiście pobierasz próbkę, którą chciałeś uzyskać? Tutaj myślę, że częste osoby mają przewagę, ponieważ wartości CI i p są dobrze skalibrowane względem ich powtarzalnych właściwości próbkowania, podczas gdy wnioskowanie bayesowskie zachowuje swój osobisty i subiektywny charakter.

Jeśli chcesz bardziej teoretycznego przedstawienia odpowiedzi Bayesa, przeczytałbym o „wnioskowaniu warunkowym”, w którym kluczowymi badaczami są Nancy Reid i Lehmann.

Scortchi - Przywróć Monikę
źródło