Próbuję zrozumieć czynnik Bayesa (BF). Uważam, że są one jak stosunek prawdopodobieństwa 2 hipotez. Jeśli więc BF wynosi 5, oznacza to, że H1 jest 5 razy bardziej prawdopodobne niż H0. A wartość 3-10 wskazuje na umiarkowane dowody, podczas gdy> 10 wskazuje na mocne dowody.
Jednak w przypadku wartości P tradycyjnie jako wartość graniczną przyjmuje się 0,05. Przy tej wartości P współczynnik prawdopodobieństwa H1 / H0 powinien wynosić około 95/5 lub 19.
Dlaczego więc dla BF przyjmuje się wartość graniczną> 3, podczas gdy dla wartości P przyjmuje się wartość> 19? Wartości te nie są nigdzie blisko.
Odpowiedzi:
Kilka rzeczy:
BF daje dowody na poparcie hipotezy, podczas gdy częsty test hipotezy daje dowody przeciwko (zerowej) hipotezie. To rodzaj „jabłek na pomarańcze”.
Te dwie procedury, pomimo różnicy w interpretacji, mogą prowadzić do różnych decyzji. Na przykład BF może odrzucić, podczas gdy częsty test hipotezy nie, lub odwrotnie. Ten problem jest często określany jako paradoks Jeffreysa-Lindleya . Na tej stronie było wiele postów na ten temat; patrz np. tutaj i tutaj .
„Przy tej wartości P prawdopodobieństwo H1 / H0 powinno wynosić 95/5 lub 19.” Nie, to nie jest prawda, ponieważ mniej więcej . Obliczenie wartości p i wykonanie testu częstego co najmniej nie wymaga żadnego pojęcia o . Ponadto wartości p są często całkami / sumami gęstości / pmfs, podczas gdy BF nie całkuje się w przestrzeni próbki danych.p ( y∣ H.1) ≠ 1 - p ( y∣ H.0) p ( y∣ H.1)
źródło
Współczynnik Bayesab01 można przekształcić w prawdopodobieństwo przy równych wagach jako
ale to ich nie czyni porównywalne z -wartość odP.01= 11 + 1b01 sp
Jeśli chcesz rozważyć bayesowski odpowiednik wartości , należy zbadać tylną predykcyjną wartość (Meng, 1994) gdzie oznacza obserwację, a jest dystrybuowany z tylnego predykcyjnego ale to nie oznacza, że te same „domyślne” kryteria odrzucenia i znaczenia powinny mieć zastosowanie do tego obiektu.p p Q 01 = P ( B 01 ( X ) ≤ B 01 ( x obs ) ) x obs X X ∼ ∫ Θ f ( x | θ ) π ( θ | x obs ) p Q01=P(B01(X)≤B01(xobs)) xobs X X∼∫Θf(x|θ)π(θ|xobs)dθ
źródło
P = B/(B+1)
Niektóre z twoich nieporozumień mogą wynikać z wzięcia liczby 95/5 bezpośrednio z faktu, że wartość p wynosi 0,05 - czy to właśnie robisz? Nie wierzę, że to jest poprawne. Na przykład wartość p dla testu t odzwierciedla szansę na uzyskanie zaobserwowanej różnicy między średnimi lub bardziej skrajnej różnicy, jeśli hipoteza zerowa jest w rzeczywistości prawdziwa. Jeśli uzyskasz wartość p wynoszącą 0,02, powiesz „ah, istnieje tylko 2% szansy na uzyskanie takiej różnicy lub większej różnicy, jeśli zero jest prawdziwe. Wydaje się to bardzo nieprawdopodobne, dlatego proponuję, aby zerowa wartość nie była prawdziwa! ”. Liczby te nie są tym samym co czynnik Bayesa, który jest stosunkiem prawdopodobieństw późniejszych podanych dla każdej konkurencyjnej hipotezy. Te późniejsze prawdopodobieństwa nie są obliczane w taki sam sposób, jak wartość p,
Na marginesie, sugerowałbym, aby zdecydowanie bronić się przed myśleniem o różnych wartościach BF jako o konkretnych rzeczach. Te przypisania są całkowicie arbitralne, podobnie jak poziom istotności .05. Problemy takie jak hakowanie p wystąpią równie łatwo w przypadku czynników Bayesa, jeśli ludzie zaczną wierzyć, że tylko określone liczby wymagają rozważenia. Postaraj się zrozumieć je takimi, jakie są, i które są czymś w rodzaju prawdopodobieństwa względnego, i użyj własnego rozsądku, aby ustalić, czy znajdziesz numer BF przekonujących dowodów, czy nie.
źródło