Clopper-Pearson dla nie matematyków

12

Zastanawiałem się, czy ktokolwiek może wyjaśnić mi intuicję poza Clopper-Pearson CI dla proporcji.

O ile mi wiadomo, każdy element CI zawiera wariancję. Jednak w przypadku proporcji, nawet jeśli moja proporcja wynosi 0 lub 1 (0% lub 100%), można obliczyć CI Cloppera-Pearsona. Próbowałem spojrzeć na formuły i rozumiem, że ma coś z percentylami rozkładu dwumianowego i rozumiem, że znalezienie CI wymaga iteracji, ale zastanawiałem się, czy ktokolwiek może wyjaśnić logikę i racjonalność w „prostych słowach” lub przy minimalnej matematyce ?

użytkownik40850
źródło

Odpowiedzi:

22

Kiedy mówisz, że jesteś przyzwyczajony do przedziałów ufności zawierających wyrażenie wariancji, myślisz o przypadku Gaussa, w którym informacje o dwóch parametrach charakteryzujących populację - jednym jest jego średnia, a drugim jej wariancja - są podsumowane przez próbkę średnia i wariancja próbki. Średnia próby szacuje średnią populacji, ale dokładność, z jaką to robi, zależy od wariancji populacji, oszacowanej z kolei przez wariancję próby. Z drugiej strony rozkład dwumianowy ma tylko jeden parametr - prawdopodobieństwo sukcesu w każdej indywidualnej próbie - a wszystkie informacje podane przez próbkę na temat tego parametru są podsumowane w całkowitej liczbie nie. sukcesy z tylu niezależnych prób. Zarówno wariancja populacji, jak i średnia są określane przez ten parametr.

Możesz uzyskać przedział ufności Cloppera-Pearsona 95% (powiedzmy) dla parametru bezpośrednio współpracując z dwumianową funkcją masy prawdopodobieństwa. Załóżmy, że obserwujesz sukcesów spośród prób. Pmf jestx nπxn

Pr(X=x)=(nx)πx(1π)nx

Zwiększaj aż prawdopodobieństwo lub mniej sukcesów spadnie do 2,5%: to twoja górna granica. Zmniejszaj aż prawdopodobieństwo lub więcej sukcesów spadnie do 2,5%: to twoja dolna granica. (Sugeruję, żebyś rzeczywiście spróbował to zrobić, jeśli nie jest to jasne z lektury). To, co tu robisz, polega na znalezieniu wartości które wzięte jako hipoteza zerowa doprowadziłyby do (tylko sprawiedliwego) odrzucenia przez test dwustronny na poziomie istotności 5%. W dłuższej perspektywie obliczone w ten sposób granice obejmują prawdziwą wartość , cokolwiek to jest, przez co najmniej 95% czasu.πxπxππ

Scortchi - Przywróć Monikę
źródło
+1. To może zasługiwać na pytanie samo w sobie, ale szybko zadam pytanie: w przypadku konkretnego zastosowania chciałbym uzyskać pojedynczą miarę niepewności (coś, co zachowuje się jak standardowy błąd średniej) dla różnych proporcji. Wiem, że istnieje szereg dwumianowych procedur CI, w tym Clopper-Pearson. Czy sensowne byłoby przyjęcie takiej wartości CI jako miary niepewności? Lub może szerokość / 1,96 / 2, aby uzyskać dokładnie SEM w granicy Gaussa.
ameba mówi Przywróć Monikę
1
@amoeba: Prawdopodobnie myślisz o małych próbkach: (1) Prawdopodobnie chcesz czegoś takiego jak CI Blaker-Spjotvoll zamiast CI opartych na teście równości ogona. (2) Rozkład ufności jest raczej nierówny, co spowodowałoby, że szerokość danego przedziału byłaby nieprzyjemnie wrażliwa na ustalony zasięg.
Scortchi - Przywróć Monikę