Jaka jest najlepsza technika do obliczenia przedziału ufności eksperymentu dwumianowego, jeśli szacujesz, że (lub podobnie ), a wielkość próby jest względnie mała, na przykład ?p = 1 n = 25
confidence-interval
binomial
Kasper
źródło
źródło
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
Odpowiedzi:
Nie używaj normalnego przybliżenia
Wiele napisano o tym problemie. Ogólnie zaleca się, aby nigdy nie stosować normalnego przybliżenia (tj. Przedziału ufności asymptotycznego / Walda), ponieważ ma on straszne właściwości pokrycia. Kod R ilustrujący to:
W przypadku małych prawdopodobieństw sukcesu możesz poprosić o 95% przedział ufności, ale tak naprawdę, powiedzmy, 10% przedział ufności!
Rekomendacje
Czego więc powinniśmy użyć? Uważam, że obecne zalecenia są wymienione w artykule Interval Estimation for a Binomial Proportion autorstwa Browna, Cai i DasGupta in Statistics Science 2001, vol. 16, nr 2, strony 101–133. Autorzy zbadali kilka metod obliczania przedziałów ufności i doszli do następującego wniosku.
Interwał Wilsona jest czasem nazywany także interwałem oceny , ponieważ opiera się na odwróceniu testu oceny.
Obliczanie przedziałów
Aby obliczyć te przedziały ufności, możesz użyć tego kalkulatora online lub
binom.confint()
funkcji wbinom
pakiecie w R. Na przykład, dla 0 sukcesów w 25 próbach, kod R byłby:Oto
bayes
interwał Jeffreysa. (Argumenttype="central"
jest potrzebny, aby uzyskać przedział równości .)Pamiętaj, że powinieneś zdecydować, której z trzech metod chcesz użyć przed obliczeniem interwału. Patrząc na wszystkie trzy i wybierając najkrótsze, naturalnie otrzymasz zbyt małe prawdopodobieństwo pokrycia.
Szybka, przybliżona odpowiedź
Na koniec, jeśli zaobserwujesz dokładnie zero sukcesów w swoich n próbach i po prostu chcesz bardzo szybkiego przybliżonego przedziału ufności, możesz zastosować zasadę trzech . Po prostu podziel liczbę 3 przez n . W powyższym przykładzie n wynosi 25, więc górna granica wynosi 3/25 = 0,12 (dolna granica to oczywiście 0).
źródło
bayes
używa wcześniejszego munduru (zamiast Jeffreya), gdy oba parametry kształtu wynoszą 1. Wysłałem e-maila z opiekunem pakietu binom z ciekawości o (nie) zaletach wcześniejszego munduru Jeffreya i powiedział mi, że nowa wersja będzie używać mundur przed jako domyślny. Nie zastanawiaj się więc, czy wyniki będą się nieco różnić w przyszłości.binconf
MetodaHmisc
również oblicza tych przedziałów. Domyślnie jest to metoda Wilsona.źródło