Jakiego testu statystycznego należy użyć do testowania wzbogacenia list genów?

10

Przeprowadziłem eksperyment, aby przetestować wrażliwość komórkową na określony czynnik uszkadzający DNA. Znaleźliśmy 270 genów, które były szczególnie wrażliwe na lek, a całkowita liczba analizowanych genów wyniosła 3668. 38 z 270 wrażliwych genów jest klasyfikowanych jako „geny naprawy DNA”. Jeśli liczba „genów naprawy DNA” zawartych w genomie wynosi 112, a całkowita liczba genów w genomie wynosi 3668, to czy wrażliwe geny wzbogacają się w geny naprawy DNA? Jakiego testu statystycznego należy użyć? Byłbym wdzięczny, gdybyś mógł mi powiedzieć jakieś narzędzie do obliczania wartości p online.

Laura
źródło

Odpowiedzi:

17

Standardową praktyką testowania wzbogacania list genów jest wykonanie testu hipergeometrycznego lub, równoważnie, jednostronnego dokładnego testu Fishera . Masz następującą zdarzeń :2×2

DNA RepairOtherSensitive38232270Not Sensitive74332433981123556

Możesz przeprowadzić test w Rnastępujący sposób:

fisher.test(matrix(c(38,74,232,3324),nrow=2,ncol=2),alternative="greater")

Co daje bardzo znaczący wynik:

Fisher's Exact Test for Count Data

data:  matrix(c(38, 74, 232, 3324), nrow = 2, ncol = 2) 
p-value < 2.2e-16
alternative hypothesis: true odds ratio is greater than 1 
95 percent confidence interval:
5.062107      Inf 
sample estimates:
odds ratio 
7.34918

Zauważ, że gdy testujemy nadmierną reprezentację (zamiast niedostatecznej reprezentacji), alternativeparametr jest ustawiony na "greater".

M. Berk
źródło
1
Wielkie dzięki za odpowiedź. Pomyślałem również, że dokładny test Fishera może być dobrą metodą analizy. Nie mam żadnego oprogramowania statystycznego do wykonywania wyników dla innych klas funkcjonalnych, które też chciałbym przetestować. Czy znasz jakieś narzędzie „online” do uzyskiwania wartości pv ze wszystkimi miejscami po przecinku?
Laura,
1
Możesz pobrać R za darmo. Zobacz r-project.org Tak więc brak oprogramowania jest nierozpuszczalny (a myślenie, że potrzebujesz sposobu obliczania online, jest błędne). Ale proszę, poszukaj trochę, aby dowiedzieć się tych rzeczy dla siebie. Zobacz porady na stronie stats.stackexchange.com/help/how-to-ask na temat zadawania dobrych pytań.
Nick Cox,
@Nick Twoja rada jest dobra, ale proszę nie przedstawiać jej jako charakterystyki plakatu: takie sformułowanie zbyt łatwo jest źle zrozumiane jako atak, który wątpię, że zamierzałeś. Dlatego usunąłem wstępne zdanie z twojego komentarza (które nie dodało do niego żadnych informacji).
whuber
Czy mógłby Pan dodatkowo wyjaśnić, nadreprezentację tego, co dokładnie jest obliczane?
sdgaw erzswer