Ostatnio badałem bayesowskie podejście do statystyki klasycznej. Po przeczytaniu o czynniku Bayesa zastanawiałem się, czy analiza mocy jest niezbędna w tym widoku statystyki. Moim głównym powodem do zastanowienia się nad tym jest fakt, że czynnik Bayesa wydaje się po prostu współczynnikiem prawdopodobieństwa. Kiedy jest to 25: 1, wydaje się, że mogę to nazwać nocą.
Czy jestem daleko? Czy mogę coś jeszcze zrobić, aby dowiedzieć się więcej? Obecnie czytam tę książkę: Wprowadzenie do statystyki bayesowskiej , WM Bolstad (Wiley-Interscience; 2nd ed., 2007).
bayesian
power-analysis
Justin Bozonier
źródło
źródło
Odpowiedzi:
Moc dotyczy prawdopodobieństwa długoterminowego p <0,05 (alfa) w przyszłych badaniach. W Bayes dowody z badania A zasilają priory do badania B itp. W dół linii. Dlatego władza zdefiniowana w statystyce częstokroć tak naprawdę nie istnieje.
źródło
Testy hipotez można wykonywać za pomocą statystyk bayesowskich. Można na przykład stwierdzić, że efekt jest większy od zera, jeśli więcej niż 95% gęstości tylnej jest większe od zera. Lub alternatywnie, możesz zastosować jakąś formę binarnej decyzji opartej na czynnikach Bayesa.
Po ustanowieniu takiego systemu decyzyjnego możliwe jest oszacowanie mocy statystycznej przy założeniu danego procesu generowania danych i wielkości próby. Można to łatwo ocenić w danym kontekście za pomocą symulacji.
To powiedziawszy, podejście bayesowskie często koncentruje się bardziej na przedziale wiarygodności niż na oszacowaniu punktowym i stopniu przekonania niż na decyzji binarnej. Korzystając z tego bardziej ciągłego podejścia do wnioskowania, można zamiast tego ocenić inne efekty wnioskowania na podstawie projektu. W szczególności możesz oszacować oczekiwany rozmiar przedziału wiarygodności dla danego procesu generowania danych i wielkości próbki.
źródło
Ten problem prowadzi do wielu nieporozumień, ponieważ ludzie używają statystyk bayesowskich do zadawania częstych pytań. Na przykład ludzie chcą ustalić, czy wariant B jest lepszy niż wariant A. Mogą odpowiedzieć na to pytanie za pomocą statystyk bayesowskich, określając, czy 95% najwyższy przedział gęstości różnicy między tymi dwoma rozkładami bocznymi (BA) jest większy niż 0 czy a region o znaczeniu praktycznym około 0. Jeśli korzystasz ze statystyk bayesowskich, aby odpowiedzieć na często zadawane pytania, nadal możesz popełniać częste błędy: typ I (fałszywie pozytywne; opps - B wcale nie jest lepszy) i typ II (chybienie; nie zdaje sobie sprawy że B jest naprawdę lepszy).
Celem analizy mocy jest ograniczenie błędów typu II (np. Mają co najmniej 80% szans na znalezienie efektu, jeśli taki istnieje). Analiza mocy powinna być również wykorzystywana przy stosowaniu statystyk bayesowskich do zadawania częstych pytań, takich jak powyższe.
Jeśli nie użyjesz analizy mocy, a następnie wielokrotnie zerkniesz na swoje dane podczas ich gromadzenia, a następnie zatrzymasz się, gdy tylko zauważysz znaczącą różnicę, to popełnisz więcej błędów typu I (fałszywych alarmów), niż możesz się spodziewać - tak samo, jak gdybyś korzystał ze statystyk częstych.
sprawdzić:
https://doingbayesiandataanalysis.blogspot.com/2013/11/optional-stopping-in-data-collection-p.html
http://varianceexplained.org/r/bayesian-ab-testing/
Warto zauważyć - Niektóre podejścia bayesowskie mogą zmniejszyć, ale nie wyeliminować, prawdopodobieństwo popełnienia błędu typu I (np. Odpowiedni uprzedni informacyjny).
źródło
Na przykład potrzeba analizy mocy w badaniu klinicznym polega na tym, aby móc obliczyć / oszacować, ilu uczestników rekrutuje się, aby mieć szansę na znalezienie efektu leczenia (o danym minimalnym rozmiarze), jeśli taki istnieje. Rekrutacja nieskończonej liczby pacjentów jest niewykonalna, po pierwsze z powodu ograniczeń czasowych, a po drugie z powodu ograniczeń kosztów.
Wyobraź sobie więc, że przyjmujemy bayesowskie podejście do wspomnianego badania klinicznego. Chociaż teoretycznie możliwe są płaskie przeory, wrażliwość na przeor jest i tak wskazana, ponieważ niestety dostępny jest więcej niż jeden przeor płaski (co dziwne, myślę teraz, ponieważ tak naprawdę powinien istnieć tylko jeden sposób wyrażenia całkowitej niepewności).
Wyobraźmy sobie zatem, że przeprowadzamy analizę wrażliwości (model, a nie tylko wcześniejszy, również byłby tutaj analizowany). Wymaga to symulacji z wiarygodnego modelu „prawdy”. W statystykach klasycznych / częstych jest czterech kandydatów na „prawdę”: H0, mu = 0; H1, mu! = 0, gdzie albo są obserwowane z błędem (jak w naszym świecie rzeczywistym) lub bez błędu (jak w nieobserwowalnym świecie rzeczywistym). W statystykach bayesowskich są tutaj dwaj kandydaci na „prawdę”: mu jest zmienną losową (jak w nieobserwowalnym świecie rzeczywistym); mu jest zmienną losową (jak w naszym obserwowalnym świecie rzeczywistym z punktu widzenia niepewnego człowieka).
Tak naprawdę zależy to od tego, kogo próbujesz przekonać A) na podstawie próby i B) na podstawie analizy wrażliwości. Jeśli to nie ta sama osoba, byłoby to dość dziwne.
W rzeczywistości chodzi o konsensus co do tego, co jest prawdą i co potwierdza namacalne dowody. Wspólna podstawa jest taka, że rozkład prawdopodobieństwa podpisu jest możliwy do zaobserwowania w naszym prawdziwym obserwowalnym świecie, który w jakiś sposób ewidentnie ma jakąś ukrytą matematyczną prawdę, która przypadkiem dzieje się tak przez przypadek, albo przez zamierzenie. Zatrzymam się tam, ponieważ nie jest to strona sztuki, ale raczej strona nauki, albo takie jest moje rozumienie.
źródło