Dlaczego wartości graniczne stosowane dla czynników Bayesa i wartości p są tak różne?

11

Próbuję zrozumieć czynnik Bayesa (BF). Uważam, że są one jak stosunek prawdopodobieństwa 2 hipotez. Jeśli więc BF wynosi 5, oznacza to, że H1 jest 5 razy bardziej prawdopodobne niż H0. A wartość 3-10 wskazuje na umiarkowane dowody, podczas gdy> 10 wskazuje na mocne dowody.

Jednak w przypadku wartości P tradycyjnie jako wartość graniczną przyjmuje się 0,05. Przy tej wartości P współczynnik prawdopodobieństwa H1 / H0 powinien wynosić około 95/5 lub 19.

Dlaczego więc dla BF przyjmuje się wartość graniczną> 3, podczas gdy dla wartości P przyjmuje się wartość> 19? Wartości te nie są nigdzie blisko.

rnso
źródło
2
Nie czuję się swobodnie mówiąc „jeśli BF wynosi , oznacza to, że jest razy bardziej prawdopodobne niż ”. Współczynnik Bayesa może być marginalnym współczynnikiem prawdopodobieństwa, ale nie jest to współczynnik prawdopodobieństwa ani iloraz szans i musi być połączony z wcześniejszym, aby był użytecznyH 1 5 H 05H15H0
Henry
Jeśli nie mamy żadnych konkretnych wcześniejszych informacji, to co możemy powiedzieć o znaczeniu BF?
rnso
Z pewnością ktoś ma „jakieś” wcześniejsze informacje, nawet jeśli mówi, że nie ma żadnych konkretnych wcześniejszych informacji. Mianowicie w takim przypadku uzasadnione jest przypisanie równych prawdopodobieństw każdej hipotezie zgodnie z zasadą obojętności. Jest to prosty przykład tak zwanego nieinformacyjnego przeora (co prawda mylnego).
dnqxt
Czy w takim przypadku BF wynoszące 5 wskazuje, że jedna hipoteza jest 5 razy bardziej prawdopodobna?
rnso
Tak, ale ten problem jest o wiele bardziej skomplikowany, niż mogłoby się wydawać, i dotyczy dziedziny wyboru modelu w statystyce. Zostałeś ostrzeżony :))
dnqxt

Odpowiedzi:

10

Kilka rzeczy:

BF daje dowody na poparcie hipotezy, podczas gdy częsty test hipotezy daje dowody przeciwko (zerowej) hipotezie. To rodzaj „jabłek na pomarańcze”.

Te dwie procedury, pomimo różnicy w interpretacji, mogą prowadzić do różnych decyzji. Na przykład BF może odrzucić, podczas gdy częsty test hipotezy nie, lub odwrotnie. Ten problem jest często określany jako paradoks Jeffreysa-Lindleya . Na tej stronie było wiele postów na ten temat; patrz np. tutaj i tutaj .

„Przy tej wartości P prawdopodobieństwo H1 / H0 powinno wynosić 95/5 lub 19.” Nie, to nie jest prawda, ponieważ mniej więcej . Obliczenie wartości p i wykonanie testu częstego co najmniej nie wymaga żadnego pojęcia o . Ponadto wartości p są często całkami / sumami gęstości / pmfs, podczas gdy BF nie całkuje się w przestrzeni próbki danych.p(yH1)1p(yH0)p(yH1)

Taylor
źródło
2
Taylor mówiąc próg dowodów na jednej hipotezy ( ) nie mogą być porównywane bezpośrednio z progiem dowodów na innej hipotezy ( ), a także nie mniej. Kiedy przestajesz wierzyć w efekt zerowy, nie musisz odnosić się do tego, kiedy zaczynasz wierzyć w alternatywę. Właśnie dlatego wartości nie należy interpretować jakoH 1 p 1 - ( wiara w H 1 )H0H1p1(belief in H1)
Frans Rodenburg
1
Może to może być wyjaśnienie: en.wikipedia.org/wiki/Misunderstandings_of_p-values częstościowym -value nie jest miarą dowodów na cokolwiek. p
Frans Rodenburg,
2
Przepraszamy, ostatni komentarz: Powodem, dla którego nie można tego uznać za dowód na korzyść jest to, że istnieje szansa na zaobserwowanie tak dużego efektu, jeśli byłoby prawdziwe. Jeśli jest rzeczywiście prawdą, wartość powinna być jednakowo losowa, więc jej wartość nie ma znaczenia dla prawdopodobieństwa . Ta subtelność w interpretacji jest jednym z powodów, dla których wartości widzą tak wiele niewłaściwego użycia. H 0 H 0 p H 1 pH1 H0H0pH1p
Frans Rodenburg,
1
@ benxyzzy: rozkład wartości jest jednolity tylko w przypadku hipotezy zerowej, a nie w przypadku alternatywy, w której jest mocno wypaczony w kierunku zera. p
Xi'an,
1
@benxyzzy Aby dodać do innych: Istotą użycia wartości jest to, że pod hipotezą zerową jest ona jednolicie losowa, więc jeśli otrzymasz bardzo małą wartość , wskazuje to, że być może nie była jednolicie losowa, więc może wartość zerowa hipoteza nie była prawdziwa. ppp
JiK,
8

Współczynnik BayesaB01 można przekształcić w prawdopodobieństwo przy równych wagach jako ale to ich nie czyni porównywalne z -wartość od

P01=11+1B01
sp

  1. P01 to prawdopodobieństwo w przestrzeni parametrów, a nie w przestrzeni próbkowania
  2. i zakres jego wartość zależy od wyboru ze stanu działania, są w ten sposób względny, a nie absolutny (a wzmianki Taylora z paradoksem Lindley-Jeffreys jest odpowiednie w tym etapie )
  3. zarówno i zawierają karę za złożoność (brzytwa Ockhama) poprzez integrację w przestrzeni parametrówB01P01

Jeśli chcesz rozważyć bayesowski odpowiednik wartości , należy zbadać tylną predykcyjną wartość (Meng, 1994) gdzie oznacza obserwację, a jest dystrybuowany z tylnego predykcyjnego ale to nie oznacza, że ​​te same „domyślne” kryteria odrzucenia i znaczenia powinny mieć zastosowanie do tego obiektu.pp Q 01 = P ( B 01 ( X ) B 01 ( x obs ) ) x obs X X Θ f ( x | θ ) π ( θ | x obs ) p

Q01=P(B01(X)B01(xobs))
xobsX
XΘf(x|θ)π(θ|xobs)dθ

Xi'an
źródło
Korzystając ze wzoru, P dla BF wynoszące 3 i 10 wynosi odpowiednio 0,75 i 0,91. Dlaczego powinniśmy uznać je za umiarkowane dowody, skoro dla wartości P utrzymujemy wartość graniczną 0,95?
rnso
Dlaczego ma znaczenie w tych ramach? czy w ogóle? Decyzja, kiedy duży jest wystarczająco duży, zależy od funkcji narzędzia. 0.95
Xi'an
Wzór wygląda jak prostszeP = B/(B+1)
rnso
2

Niektóre z twoich nieporozumień mogą wynikać z wzięcia liczby 95/5 bezpośrednio z faktu, że wartość p wynosi 0,05 - czy to właśnie robisz? Nie wierzę, że to jest poprawne. Na przykład wartość p dla testu t odzwierciedla szansę na uzyskanie zaobserwowanej różnicy między średnimi lub bardziej skrajnej różnicy, jeśli hipoteza zerowa jest w rzeczywistości prawdziwa. Jeśli uzyskasz wartość p wynoszącą 0,02, powiesz „ah, istnieje tylko 2% szansy na uzyskanie takiej różnicy lub większej różnicy, jeśli zero jest prawdziwe. Wydaje się to bardzo nieprawdopodobne, dlatego proponuję, aby zerowa wartość nie była prawdziwa! ”. Liczby te nie są tym samym co czynnik Bayesa, który jest stosunkiem prawdopodobieństw późniejszych podanych dla każdej konkurencyjnej hipotezy. Te późniejsze prawdopodobieństwa nie są obliczane w taki sam sposób, jak wartość p,

Na marginesie, sugerowałbym, aby zdecydowanie bronić się przed myśleniem o różnych wartościach BF jako o konkretnych rzeczach. Te przypisania są całkowicie arbitralne, podobnie jak poziom istotności .05. Problemy takie jak hakowanie p wystąpią równie łatwo w przypadku czynników Bayesa, jeśli ludzie zaczną wierzyć, że tylko określone liczby wymagają rozważenia. Postaraj się zrozumieć je takimi, jakie są, i które są czymś w rodzaju prawdopodobieństwa względnego, i użyj własnego rozsądku, aby ustalić, czy znajdziesz numer BF przekonujących dowodów, czy nie.

Jamie
źródło