Wiele częstych przedziałów ufności (CI) opiera się na funkcji prawdopodobieństwa. Jeśli poprzednia dystrybucja jest naprawdę nieinformacyjna, to późniejszy bayesowski ma zasadniczo te same informacje, co funkcja prawdopodobieństwa. W związku z tym w praktyce przedział prawdopodobieństwa Bayesa (lub przedział wiarygodny) może być bardzo podobny liczbowo do częstego przedziału ufności. [Oczywiście, nawet jeśli pod względem liczbowym są podobne, istnieją filozoficzne różnice w interpretacji między oszacowaniami interwałowymi a bayesowskimi.]
Oto prosty przykład oszacowania prawdopodobieństwa sukcesu dwumianowego θ.
Załóżmy, że mamy n=100 obserwacji (prób) z X=73 sukcesów.
Częstościowym: Tradycyjne Wald przedział zastosowania estymacja punktowa
θ = X / n = 73 / 100 = 0,73. A 95% CI w postaci
θ ± 1,96 √θ^=X/n=73/100=0.73.
θ^±1.96θ^(1−θ^)n−−−−−−−−√,
co oblicza do
(0.643,0.817).
n = 100; x = 73; th.w = x/n; pm = c(-1,1)
ci.w = th.w + pm*1.96*sqrt(th.w*(1-th.w)/n); ci.w
[1] 0.6429839 0.8170161
Ta forma CI zakłada, że odpowiednie rozkłady dwumianowe mogą być aproksymowane przez normalne, a margines błędu jest dobrze przybliżony przez
W szczególności dla małych założenia te nie muszą być prawdziwe. [Przypadki, w których lub są szczególnie problematyczne.] √θ(1−θ)/n−−−−−−−−−√n,X=0X=nθ^(1−θ^)/n−−−−−−−−−√.n,X=0X=n
Wykazano, że Agresti-Coull CI ma bardziej dokładne prawdopodobieństwo pokrycia. Ten przedział „dodaje dwa sukcesy i dwa niepowodzenia” jako sposób na zbliżenie prawdopodobieństwa pokrycia do 95%. Zaczyna się od oszacowania punktowego
gdzie ˜ n + 4. Następnie 95% CI ma postać
˜ θ ± 1,96 √θ~=(X+2)/n~,n~+4.
co oblicza do(0,612,0,792). Dlan>100i0,3<~θ<0,7,różnica pomiędzy tymi dwoma stylów przedziałów ufności jest prawie bez znaczenia.
θ~±1.96θ~(1−θ~)n~−−−−−−−−√,
(0.612,0.792).n>1000.3<θ~<0.7,
ci.a = th.a + pm*1.96*sqrt(th.a*(1-th.a)/n); ci.a
[1] 0.6122700 0.7915761
Bayesian:
Jednym z popularnych nieinformacyjnych uprzednich w tej sytuacji jest Funkcja prawdopodobieństwa jest proporcjonalna do
θ x ( 1 - θ ) n - x . Mnożąc jądra wcześniejszego i prawdopodobieństwa, mamy jądro rozkładu tylnego
B e t a ( x + 1 ,B e t a (1,1)≡Unif( 0 ,1).θx( 1 - θ )n - x.B e t a (x+1,n - x + 1 ) .
Następnie 95% oszacowanie przedziału Bayesa wykorzystuje kwantyle 0,025 i 0,975 rozkładu tylnego, aby uzyskać
Gdy wcześniejszy rozkład jest „płaski” lub „nieinformacyjny”, różnica liczbowa między przedziałem prawdopodobieństwa Bayesa a przedziałem ufności Agresti-Coull jest niewielka.( 0,635 ; 0,807 ) .
qbeta(c(.025, .975), 74, 28)
[1] 0.6353758 0.8072313
Uwagi: (a) W tej sytuacji niektórzy Bayesiści wolą nieinformacyjne wcześniejsze (b) W przypadku poziomów ufności innych niż 95%, Agresti-Coull CI stosuje nieco inne oszacowanie punktowe. (c) W przypadku danych innych niż dwumianowy może nie być wcześniej dostępnego „płaskiego”, ale można wybrać przeora z dużą wariancją (mała precyzja), który przenosi bardzo mało informacji. (d) Aby uzyskać więcej informacji na temat CI CI Agresti-Coull, wykresów prawdopodobieństwa pokrycia i niektórych odniesień, być może zobacz także te pytania i odpowiedzi .B e t a (.5,.5).
Prawdopodobieństwo≠ Bayesian z płaskim przeorem
Funkcja prawdopodobieństwa i związany z nią przedział ufności nie są takie same (pojęcie), jak prawdopodobieństwo bayesowskie a posteriori skonstruowane za pomocą uprzedniego, który określa rozkład równomierny.
W części 1 i 2 tej odpowiedzi argumentowane jest, dlaczego prawdopodobieństwo nie powinno być postrzegane jako tylne prawdopodobieństwo Bayesa oparte na wcześniejszym płaskim.
W części 3 podano przykład, w którym przedział ufności i przedział wiarygodności są bardzo różne. Wskazano również, w jaki sposób powstaje ta rozbieżność.
1 Inne zachowanie podczas transformacji zmiennej
Prawdopodobieństwa przekształcają się w określony sposób . Znając rozkład rozkładu prawdopodobieństwafax( x ) znamy również rozkład faξ( ξ) dla zmiennej ξ zdefiniowanej przez dowolną funkcję x = χ ( ξ) , zgodnie z regułą transformacji:
Jeśli transformujesz zmienną, wówczas średnia i tryb mogą się różnić z powodu tej zmiany funkcji rozkładu. Oznacza tox¯≠ χ ( ξ¯) i xmax f( x )≠ χ( ξmax f( ξ)) .
Funkcja wiarygodności nie przekształca się w ten sposób . Jest to kontrast między funkcją prawdopodobieństwa a prawdopodobieństwem późniejszym. Funkcja (maksimum) prawdopodobieństwa pozostaje taka sama po przekształceniu zmiennej.
Związane z:
Mieszkanie przeora jest niejednoznaczne . To zależy od formy konkretnej statystyki.
Na przykład, jeżeliX jest jednolita rozdzielone (na przykład U( 0 , 1 ) ) , a X2) jest nie zmienna jednolity rozdzielone.
Nie ma jednego mieszkania przed którym można by powiązać funkcję Prawdopodobieństwa. Jest inaczej, gdy definiujesz mieszkanie przedX lub jakąś zmienioną zmienną, taką jak X2) . Dla prawdopodobieństwa ta zależność nie istnieje.
Granice prawdopodobieństwa (przedziały wiarygodności) będą się różnić po przekształceniu zmiennej (w przypadku funkcji wiarygodności tak nie jest) . Np. Dla niektórych parametrówza i transformacji monotonicznej fa( ) (np. Logarytm) otrzymujesz równoważne przedziały prawdopodobieństwa
zaminfa( amin)<<zafa( )<<zamaxfa( amax)
2 Inna koncepcja: przedziały ufności są niezależne od wcześniejszych
Przedział ufności nie wykorzystuje informacji o przejęciu, podobnie jak przedział wiarygodności (zaufanie nie jest prawdopodobieństwem).
W przypadku wiarygodnego okresu koncepcja ta (x
3 Różnica między zaufaniem a wiarygodnymi przedziałami
Granice są tworzone, uzyskując (jednowymiarową) funkcję rozkładu skumulowanego. Ale integracja / kumulacja może odbywać się w dwóch kierunkach .
Różnica między interwałami występuje, ponieważ obszary 5% są tworzone na różne sposoby.
Przypadek, w którym przedział ufności i przedział wiarygodności (oparty na niewłaściwym wcześniejszym czasie) pokrywają się, służy do oszacowania średniej zmiennej rozproszonej Gaussa (rozkład jest zilustrowany tutaj: https://stats.stackexchange.com/a/351333/164061 ).
Oczywisty przypadek, w którym przedział ufności i przedział wiarygodności nie pokrywają się, jest zilustrowany tutaj ( https://stats.stackexchange.com/a/369909/164061 ). Przedział ufności dla tego przypadku może mieć jedną lub nawet obie (górne / dolne) granice w nieskończoności.
źródło
Zasadniczo nie jest to prawdą, ale może się tak wydawać z powodu najczęściej rozważanych przypadków specjalnych.
Technika warunkowania Fishera w statystyce pomocniczej daje w tym przypadku przedział ufności, który pokrywa się z tym wiarygodnym przedziałem.
źródło
Z mojej lektury pomyślałem, że to stwierdzenie jest prawdziwe asymptotycznie, tj. Dla dużej wielkości próby i jeśli ktoś używa nieinformacyjnego uprzedniego.
Prosty przykład liczbowy wydaje się to potwierdzać - 90% przedziały maksymalnego prawdopodobieństwa profilu i 90% wiarygodne przedziały dwumianowego GLM ML i dwumianowego GLM Bayesa są w rzeczywistości praktycznie identyczne
n=1000
, chociaż rozbieżność byłaby większa dla małychn
:Jak widać w powyższym przykładzie, dla
n=1000
90% przedziałów ufności profilu dwumianowego GLM są praktycznie identyczne z 90% wiarygodnymi przedziałami dla dwumianowego GLM Bayesa (różnica jest również w granicach stosowania różnych nasion i różnych liczby iteracji w atakach bayesowskich, a dokładnej równoważności nie można również uzyskać, ponieważ podanie 100% nieinformacyjnego uprzedniego nie jest również możliwe za pomocąrstanarm
lubbrms
).źródło