Wielkość próby dla proporcji w powtarzanych pomiarach

Próbuję pomóc naukowcowi w opracowaniu badania dotyczącego występowania drobnoustrojów salmonelli. Chciałby porównać eksperymentalny preparat przeciwdrobnoustrojowy z chlorem (wybielaczem) na fermach drobiu. Ponieważ częstości występowania salmonelli w tle różnią się w czasie, planuje on zmierzyć% drobiu w / salmonelli przed leczeniem i po leczeniu. Zatem pomiar będzie różnicą przed / po% salmonelli dla formuł eksperymentalnych w porównaniu z chlorem.

Czy ktoś może doradzić, jak oszacować niezbędną wielkość próby? Powiedzmy, że wskaźnik tła wynosi 50%; po wybielaczu jest to 20%; i chcemy wykryć, czy preparat eksperymentalny zmienia szybkość o +/- 10%. Dziękuję Ci

EDYCJA: Mam problem z włączeniem wskaźników tła. Nazwijmy je p3 i p4, czyli „przed” wskaźnikami salmonelli odpowiednio dla wybielaczy i próbek eksperymentalnych. Tak więc statystyka do oszacowania jest różnicą różnic: eksperymentalna (po-przed) - wybielacz (po-przed) = (p0-p2) - (p3-p1). Aby w pełni uwzględnić zmienność próbkowania współczynników „przed” p2 i p3 w obliczeniach wielkości próby --- czy jest to tak proste, jak użycie p0 (1-p0) + p1 (1-p1) + p2 (1-p2) + p3 (1-p3), gdziekolwiek występuje warunek zmiany w równaniu wielkości próbki? Niech wszystkie rozmiary próbek będą równe, n1 = n2 = n.

sample-size repeated-measures proportion Paweł
źródło

To świetne pytanie. Optymalne rozwiązanie będzie zależeć od niektórych dodatkowych rzeczy, w tym (a) głównych elementów kosztu, w tym kosztu włączenia jednego gospodarstwa i kosztu pomiaru jednego przedmiotu; oraz (b) projekt eksperymentalny. Na przykład, czy zarówno leczenie, jak i rozwiązania kontrolne zostaną zastosowane w każdym gospodarstwie (dobry wybór, ale nie bez potencjalnych problemów), czy będziesz w stanie zastosować tylko jedno rozwiązanie w każdym gospodarstwie? Czy podmioty będą grupowane (fizycznie) w gospodarstwach, czy będą leczone i pobierane próbki naprawdę losowo?

whuber

Włączyłem twoją odpowiedź rozszerzenia do pytania.

Odpowiedzi:

Weźmy dźgnięcie w przybliżeniu pierwszego rzędu, zakładając proste losowe pobieranie próbek i stały odsetek infekcji dla każdego leczenia. Załóżmy, że wielkość próbki jest na tyle duża, że można zastosować normalne przybliżenie w teście hipotez proporcji, abyśmy mogli obliczyć statystykę az w ten sposób

$z = \frac{p_t - p_0}{\sqrt{p_0(1-p_0)(\frac{1}{n_1}+\frac{1}{n_2})}}$

Jest to statystyka przykładowa dla testu z dwiema próbkami, nowa formuła vs. wybielacz, ponieważ spodziewamy się, że efekt wybielacza będzie losowy, a także efekt nowej formuły.

Wtedy pozwolić $n = n_1 = n_2$ , ponieważ zrównoważone eksperymenty mają największą moc i wykorzystaj to w swoich specyfikacjach $|p_t - p_0| \geq 0.1$ , $p_0 = 0.2$ . Aby uzyskać statystyki testowe $|z| \geq 2$ (Błąd typu I około 5%), to działa $n \approx 128$ . Jest to rozsądna wielkość próby, aby normalne przybliżenie działało, ale zdecydowanie jest to dolna granica.

Poleciłbym wykonać podobne obliczenia w oparciu o pożądaną moc testu w celu kontroli błędu typu II, ponieważ słabo rozwinięta konstrukcja ma wysokie prawdopodobieństwo pominięcia rzeczywistego efektu.

Po wykonaniu wszystkich tych podstawowych zadań zacznij szukać adresów whuberów . W szczególności ze stwierdzenia problemu nie wynika jasno, czy mierzone próbki drobiu to różne grupy podmiotów, czy te same grupy podmiotów. Jeśli są takie same, jesteś na terytorium w sparowanym t teście lub w ramach powtarzanych pomiarów i potrzebujesz pomocy kogoś mądrzejszego ode mnie!

Mike Anderson
źródło

Dobry początek (+1). Formuła wymaga pewnych poprawek. Wariancja różnicy proporcji jest równa p0 (1-p0) / n0 + p1 (1-p1) / n1. Przy n0 = n1 = n, a p0 = .5, p1 = .2, co równa się 0,41 / n, co oznacza n = 41 z ^ 2. Zauważ też, że jest to test jednostronny, więc z = 1,65 działa dobrze. (Potrzebna jest tutaj pewna precyzja, ponieważ wynik jest wrażliwy na podniesienie kwadratu z.) Niezależnie od tego, obliczenia te ustalają, że około 10 ^ 2 niezależnych podmiotów będzie musiało zostać przetestowanych, jeśli ten model jest poprawny. (Ja nie oczekiwać, że wybielacz lub nowa formuła mieć „random” efekty.)

whuber

Mike Anderson i Whuber, dziękuję za sugestie. Zadałeś dobre pytania, na które spróbuję odpowiedzieć. Jednostki doświadczalne dotyczące drobiu będą losowe, a nie zgrupowań. Na razie koszt nie jest brany pod uwagę.

Paul