Porównanie dwóch próbek proporcji, oszacowanie wielkości próby: R vs Stata

10

Porównanie dwóch próbek proporcji, oszacowanie wielkości próby: R vs Stata

Otrzymałem różne wyniki dla wielkości próbek, jak następuje:

W R.

power.prop.test(p1 = 0.70, p2 = 0.85, power = 0.90, sig.level = 0.05)

Wynik: (czyli 161) dla każdej grupy.n=160.7777

W Stacie

sampsi 0.70 0.85, power(0.90) alpha(0.05)

Wynik: dla każdej grupy.n=174

Skąd ta różnica? Dzięki.

BTW, uruchomiłem to samo obliczenie wielkości próbki w SAS JMP , wynik: (prawie taki sam jak wynik R).n=160

dwstu
źródło

Odpowiedzi:

7

Różnica wynika z faktu, że sampsipolecenie Staty (przestarzałe od Staty 13 i zastąpione przez power) domyślnie używa korekcji ciągłości, podczas gdy R power.prop.test()nie (szczegółowe informacje na temat wzoru stosowanego przez Stata, patrz [PSS] power twoproportions ). Można to zmienić za pomocą nocontinuityopcji, np.

sampsi 0.70 0.85, power(0.90) alpha(0.05) nocontinuity

co daje wielkość próby 161 na grupę. Zastosowanie korekcji ciągłości daje bardziej konserwatywny test (tj. Większy rozmiar próbki) i oczywiście ma mniejsze znaczenie wraz ze wzrostem wielkości próbki.

Frank Harrell w dokumentacji bpower(części swojego pakietu Hmisc ) zwraca uwagę, że formuła bez korekcji ciągłości jest dość dokładna, tym samym uzasadniając rezygnację z korekty.

Phil Schumm
źródło
2
Świetna odpowiedź. Wydaje się, że nie różnica między dwiema metodami w moim poście jest przyczyną różnicy, ale fakt, że jedna z tych metod wykorzystuje korektę ciągłości, a druga nie.
Michael M,
1
Dzięki. Mając tylko dwie proporcje (tj. Tabelę 2x2), nie ma znaczenia, czy podasz alternatywę jako dwie proporcje czy jedną proporcję i iloraz szans. A ponieważ dokładny test Fishera jest zachowawczy dla dwumianowego problemu dwumianowego, oparte na tym szacunki mocy są bliższe szacunkom z wzoru skorygowanego o ciągłość.
Phil Schumm,
1
Dzięki @pschumm. Wypróbowałem pakiety Hmiscbsamsize(0.70, 0.85, alpha=0.05, power=0.90) i otrzymałem . n1=n2=160.7777
dwstu