Obliczanie wielkości próbki parametrycznej i analiza nieparametryczna

Jestem ciekawy, czy ktoś ma określone odniesienie (tekst lub artykuł w czasopiśmie), aby poprzeć powszechną praktykę w literaturze medycznej wykonywania obliczeń wielkości próby przy użyciu metod parametrycznych (tj. Zakładając normalny rozkład i pewną wariancję pomiarów) kiedy analiza pierwotnego wyniku próby zostanie przeprowadzona przy użyciu metod nieparametrycznych.

Przykład: głównym rezultatem jest czas wymiotowania po podaniu określonego leku, o którym wiadomo, że ma średnią wartość 20 minut (SD 6 minut), ale ma zauważalnie skośny rozkład. Obliczenia wielkości próby dokonuje się przy założeniach wymienionych powyżej, z wykorzystaniem wzoru

$n(\text{per-group})=f(\alpha,\beta) \times (2\sigma^2 /(\mu_1 - \mu_2)^2 )$ ,

gdzie zmienia się w zależności od pożądanych błędów i . $f(\alpha, \beta)$ $\alpha$ $\beta$

Jednak ze względu na skośność rozkładu analiza pierwotnego wyniku będzie oparta na szeregach (metoda nieparametryczna, taka jak test U Manna Whitneya).

Czy ten schemat jest obsługiwany przez autorów w literaturze statystycznej, czy też należy wykonywać nieparametryczne oszacowania wielkości próby (i jak by to zrobić)?

Uważam, że dla ułatwienia obliczeń dopuszczalna jest powyższa praktyka. W końcu szacunki wielkości próby są po prostu takie - szacunki, które przyjmują już kilka założeń - z których wszystkie są prawdopodobnie nieco (lub bardzo!) Nieprecyzyjne. Jestem jednak ciekawy, co myślą inni, a konkretnie, czy istnieją odniesienia do tego rozumowania.

Wielkie dzięki za wszelką pomoc.

nonparametric sample-size pmgjones
źródło

Odpowiedzi:

Brzmi dla mnie podejrzanie. Metody nieparametryczne prawie zawsze wymagają większej liczby stopni swobody niż metody parametryczne i dlatego potrzebują więcej danych. W twoim konkretnym przykładzie test Manna-Whitneya ma niższą moc niż test t, a zatem dla tej samej określonej mocy i wielkości potrzeba więcej danych.

Prostym sposobem wykonania obliczenia wielkości próbki dla dowolnej metody (nieparametrycznej lub innej) jest zastosowanie metody ładowania początkowego.

Rob Hyndman
źródło

Zgadzam się z tobą, chociaż większość obliczeń wielkości próby, które są wykonywane przy opracowywaniu RCT, oparte są na modelach parametrycznych. Podoba mi się podejście bootstrap, ale wydaje się, że niewiele badań na nim opiera się. Właśnie znalazłem te papiery, które mogą być interesujące: bit.ly/djzzeS , bit.ly/atCWz3 , a ten idzie w przeciwnym kierunku do bit.ly/cwjTHe dla skal pomiaru zdrowia.

chl

Zgadzam się z podejściem do ładowania początkowego. Ale moc nie jest funkcją stopni swobody. W wielu przypadkach, w tym w tym, test Manna-Whitneya często ma większą moc niż test t. Zobacz tbf.coe.wayne.edu/jmasm/sawilowsky_misconceptions.pdf . Ogólnie rzecz biorąc, moc testu parametrycznego jest dobra, gdy założenia parametryczne są prawdziwe, ale mogą być niższe - czasami drastycznie - gdy te założenia są naruszane, podczas gdy dobre testy nieparametryczne utrzymują swoją moc.

whuber

@RobHyndman - przepraszam, że wykopałem stary wątek sprzed 6 lat, ale zastanawiam się, czy możesz podać odniesienie do ostatniego zdania. Jak mogę użyć metody ładowania początkowego, aby uzyskać obliczenie wielkości próbki? Zakładam, że nie zebrałem jeszcze danych (ponieważ próbuję dowiedzieć się, ile zebrać), ale znam moc, której chcę, poziom istotności i wielkość efektu, który chcę wykryć. Dzięki!

David White,

Okej, myślę, że to może zadziałać tylko wtedy, gdy masz wstępne badanie do ponownego próbkowania. W przypadku pierwszego badania bez wcześniejszej wiedzy najlepiej jest obliczyć wielkość efektu z rozkładu normalnego (lub z innego rozkładu, jeśli teoria sugeruje, że dane powinny być dystrybuowane w ten sposób) i dodać trochę, aby uwzględnić potencjalną nienormalność. Po przeprowadzeniu jednego badania można użyć funkcji boostrapping do obliczenia wielkości próbek w celu wykrycia różnych rozmiarów efektów w kolejnych badaniach. Można nawet dopasować krzywą wielkości efektu do n na podstawie ładowania kilku wartości n.

David White,

Wydaje się, że niektórzy używają koncepcji Pitman Asymptotycznej Sprawności Względnej (ARE), aby zawyżać wielkość próby uzyskaną za pomocą wzoru wielkości próby do testu parametrycznego. Jak na ironię, aby go obliczyć, należy ponownie założyć rozkład ... patrz np. Wielkość próby dla testu U Manna-Whitneya Na końcu artykułu znajdują się linki, które zawierają wskazówki do dalszego czytania.

psj
źródło