Mamy potencjalny biomarker do przewidywania, czy pacjent ma raka, czy nie. Wynik testu biomarkera jest dodatni lub ujemny. Chcemy dowiedzieć się, jaką liczbę pacjentów należy zbadać, aby ustalić, czy ten biomarker jest dobrym predyktorem, czy nie.
Z lektury w Internecie wydaje się, że najlepiej jest przyjrzeć się czułości (liczby przypadków) i specyficzności (liczbie kontroli). Sugeruje się, aby potraktować tę sytuację jako test proporcji jednej próby, ale nie jest jasne, w jaki sposób należy szacować czułość i zakres, do którego jesteś przygotowany. Jeśli powiesz, że uważam jakikolwiek biomarker o czułości większej niż 0,8 za „dobry”, jak ustawiłbyś te dwie zmienne? Chciałbym, aby moja hipoteza zerowa była biomarkerem, nie jest lepsza niż losowe przypisanie, tj. Czułość 0,5. Czy ktoś mógłby podać przykład najlepszego sposobu na zrobienie tego (szczególnie jeśli jest to w R).
Odpowiedzi:
Porozmawiajmy o wrażliwości (którą oznaczymy przez ), specyficzność jest podobna. Oto podejście częste; Byłoby wspaniale, gdyby jeden z Bayesian mógł dodać kolejną odpowiedź, aby omówić alternatywny sposób rozwiązania tego problemu.p
Załóżmy, że zwerbowałeś osób chorych na raka. Do każdego z nich zastosujesz test biomarkera, aby uzyskać ciąg zer i jedynek, które nazwiemy . Wpisy będą miały rozkład Bernoulliego z prawdopodobieństwem sukcesu p . Oszacowanie p wynosi P = Σ x / n . Mam nadzieję, że p jest „duży”, a można ocenić precyzję swojej oszacowania poprzez przedziału ufności dla p .n p p p^= ∑ x / n p^ p
x
x
Istnieją co najmniej dwa podejścia - analityczne i symulacyjne.
pwr
Pakiet wR
już istnieje, aby pomóc w tym projekcie - trzeba go najpierw zainstalować. Następnie potrzebujesz rozmiaru efektu, a następnie pożądaną funkcją jestpwr.p.test
.Gdy zdobędziesz swoje dane, sposobem na uruchomienie testu jest (symuluję dane ze względu na argument).
EDYCJA: Jeśli bardziej podoba ci się podejście do symulacji, możesz to zrobić w następujący sposób: ustaw
i niech
runTest
będziewięc oszacowanie mocy jest
źródło