Analiza mocy dla danych dwumianowych, gdy hipoteza zerowa jest taka, że

10

Chciałbym przeprowadzić analizę mocy dla pojedynczej próbki z danych dwumianowych, przy H0:p=0 , w porównaniu do H1:p=0.001 , gdzie p jest odsetkiem sukcesów w populacji. Jeśli 0<p<1 , mógłbym użyć albo normalnego przybliżenia do dwumianowego, albo , ale przy , oba kończą się niepowodzeniem. Chciałbym wiedzieć, czy istnieje sposób na przeprowadzenie tej analizy. Byłbym bardzo wdzięczny za wszelkie sugestie, komentarze lub referencje. Wielkie dzięki! p = 0χ2p=0

użytkownik765195
źródło
Dlaczego więc nie zastosujesz dokładnego testu Cloppera-Pearsona?
Stéphane Laurent,
2
Mam nadzieję, że masz naprawdę dużą próbkę! To będzie trudne do przetestowania.
Peter Flom

Odpowiedzi:

13

Masz jednostronny, dokładny hipoteza alternatywna gdzie p 1 = 0,001 i p 0 = 0 .p1>p0p1=0.001p0=0

  • ccnα=0.05c=1n1α>0
  • Drugim krokiem jest ustalenie prawdopodobieństwa osiągnięcia co najmniej sukcesów w próbce o rozmiarze pod alternatywną hipotezą - to twoja moc. Tutaj potrzebujesz stałej tak że rozkład dwumianowy jest w pełni określony.n n B ( n , p 1 )cnnB(n,p1)

Drugi krok w R przy :n=500

> n  <- 500                 # sample size
> p1 <- 0.001               # success probability under alternative hypothesis
> cc <- 1                   # threshold
> sum(dbinom(cc:n, n, p1))  # power: probability for cc or more successes given p1
[1] 0.3936211

Aby dowiedzieć się, jak zmienia się moc wraz z rozmiarem próbki, możesz narysować funkcję mocy: wprowadź opis zdjęcia tutaj

nn   <- 10:2000                 # sample sizes
pow  <- 1-pbinom(cc-1, nn, p1)  # corresponding power
tStr <- expression(paste("Power for ", X>0, " given ", p[1]==0.001))
plot(nn, pow, type="l", xaxs="i", xlab="sample size", ylab="power",
     lwd=2, col="blue", main=tStr, cex.lab=1.4, cex.main=1.4)

Jeśli chcesz wiedzieć, jakiej wielkości próbki potrzebujesz, aby uzyskać co najmniej określoną moc, możesz użyć wartości mocy obliczonych powyżej. Powiedz, że chcesz mocy co najmniej .0.5

> powMin <- 0.5
> idx    <- which.min(abs(pow-powMin))  # index for value closest to 0.5
> nn[idx]     # sample size for that index
[1] 693

> pow[idx]    # power for that sample size
[1] 0.5000998

Potrzebujesz próbki o wielkości co najmniej aby uzyskać moc 0,5 .6930.5

karakal
źródło
Zgodnie z pwr.p.test, dla mocy 0,5 potrzebujesz co najmniej 677 obserwacji. Ale moc = 0,5 jest bardzo niska!
Jessica
@caracal Czy używasz normalnego przybliżenia, aby uzyskać krzywą mocy? Dokładna dwumianowa funkcja mocy nie byłaby tak płynna. W rzeczywistości jest piłowany, co można zobaczyć, jeśli oś wielkości próbki jest powiększona. Omawiam to w moim artykule z 2002 r. W American Statistician współautorem z Christine Liu. Również dwumian jest tak mocno przekrzywiony przy bardzo niskim p, że n musi być duże, aby normalne przybliżenie działało poprawnie.
Michael R. Chernick
2
@MichaelChernick Nie, to z rozkładów dwumianowych, a nie z normalnego przybliżenia. Oczywiście masz rację, że - ogólnie - moc do testu dwumianowego jest funkcją piłokształtną, która nie jest monotoniczna. Zauważ jednak, że mamy tutaj specjalny przypadek z . Oznacza to, że region akceptacji dla alternatywnej hipotezy zaczyna się zawsze od 1, niezależnie od n . Przy stałym progu c = 1 , stałej p 1 = 0,001 , moc jest ściśle rosnącą funkcją n . p0=0nc=1p1=0.001n
caracal
@Jessica Uwaga: pwr.p.test()używa normalnego przybliżenia, a nie dokładnych rozkładów dwumianowych. Wystarczy wpisać, pwr.p.testaby zobaczyć kod źródłowy. Znajdziesz wezwania do pnorm()wskazania, że ​​zastosowano przybliżenie.
caracal
1
@caracal Więc mogę spojrzeć na to w ten sposób: pod hipotezą zerową prawdopodobieństwo sukcesu wynosi 0, dlatego jeśli kiedykolwiek zobaczysz sukces, możesz odrzucić hipotezę zerową. Dlatego mówisz, że próg wynosi 1, ponieważ jeśli suma dwumianowa kiedykolwiek osiągnie 1, możesz odrzucić z błędem typu 2 wynoszącym 0! Teraz alternatywnie prawdopodobieństwo pierwszego sukcesu w n-tym badaniu wynosi (1-p) n - 1 p. Prawdopodobieństwo to wynosi 0, a n nieskończoności. Zatem sekwencyjna reguła przechodzi do zatrzymania, gdy S n = 1 miałby moc 1 dla dowolnego p> 0. n1n
Michael R. Chernick
3

Możesz łatwo odpowiedzieć na to pytanie, korzystając z pwrpakietu w języku R.

Konieczne będzie zdefiniowanie poziomu istotności, mocy i wielkości efektu. Zazwyczaj poziom istotności jest ustawiony na 0,05, a moc jest ustawiona na 0,8. Wyższa moc będzie wymagała więcej obserwacji. Niższy poziom istotności obniży moc.

Wielkość efektu dla proporcji użytych w tym pakiecie to h Cohena. Wartość odcięcia dla małego h często przyjmuje się jako 0,20. Rzeczywista wartość graniczna zależy od aplikacji i może być mniejsza w twoim przypadku. Mniejszy h oznacza, że ​​wymagane będą dalsze obserwacje. Powiedziałeś, że twoją alternatywą jest . To jest bardzo małep=0.001

> ES.h(.001, 0)
[1] 0.0632561

Ale nadal możemy kontynuować.

 > pwr.p.test(sig.level=0.05, power=.8, h = ES.h(.001, 0), alt="greater", n = NULL)

 proportion power calculation for binomial distribution (arcsine transformation) 

          h = 0.0632561
          n = 1545.124
  sig.level = 0.05
      power = 0.8
alternative = greater

Korzystając z tych wartości, potrzebujesz co najmniej 1546 obserwacji.

Jessica
źródło
1

W twoim konkretnym przypadku istnieje proste dokładne rozwiązanie:

H0:p=0p0

H1:p=0.0011β

1β1(1p)(k1)

p=0.00180

pływak
źródło
Po przeczytaniu komentarzy do rozwiązania 1 zdaję sobie sprawę, że jest to zasadniczo to samo rozwiązanie, które otrzymujesz, jeśli trzymasz się odpowiedzi. Niemniej jednak nigdy nie zaszkodzi przeliterować pewnych podstawowych wyników teorii prawdopodobieństwa, bez potrzeby dochodzenia do nich intuicyjnie.
unoszą się