Przeprowadzam niezależnych testów statystycznych z tą samą hipotezą zerową i chciałbym połączyć wyniki w jedną wartość . Wydaje się, że istnieją dwie „akceptowane” metody: metoda Fishera i metoda Stouffera .
Moje pytanie dotyczy metody Stouffera. Dla każdego osobnego testu otrzymuję wynik Z- . Zgodnie z hipotezą zerową, a każdy z nich jest rozprowadzany z rozkładu normalnego, to suma wynika z rozkładu normalnego o wariancji . Dlatego metoda Stouffera sugeruje obliczenie , które powinny być normalnie rozłożone z wariancją jednostkową, a następnie użyć tego jako łącznego wyniku Z.
To rozsądne, ale oto inne podejście, które wymyśliłem i które dla mnie również brzmi rozsądnie. Ponieważ każdy z pochodzi ze standardowego rozkładu normalnego, suma kwadratów powinna pochodzić z rozkładu chi-kwadrat o stopniach swobody. Można więc obliczyć i przekonwertować go na wartość za pomocą skumulowanej funkcji rozkładu chi-kwadrat o stopniach swobody ( , gdzie to CDF).
Jednak nigdzie nie mogę znaleźć takiego podejścia. Czy kiedykolwiek był używany? Czy to ma imię? Jakie byłyby zalety / wady w porównaniu z metodą Stouffera? A może w moim rozumowaniu jest jakaś wada?
źródło
Odpowiedzi:
Jedną z wad, która wyskakuje, jest metoda Stouffera, która może wykryć systematyczne przesunięcia w , czego zwykle można się spodziewać, gdy jedna alternatywa jest konsekwentnie prawdziwa, podczas gdy metoda chi-kwadrat wydaje się mieć mniejszą moc do tego. Szybka symulacja pokazuje, że tak jest; metoda chi-kwadrat jest mniej skuteczna w wykrywaniu jednostronnej alternatywy. Oto histogramy wartości p obiema metodami (czerwony = Stouffer, niebieski = Chi-kwadrat) w 10 5 niezależnych powtórzeń o N = 10 i różnych jednostronnie standaryzowanych efektów jj, począwszy od zera ( μ = 0 ) przez 0,6 SD ( μ =zi 105 N=10 μ μ=0 0.6 ).μ=0.6
Lepsza procedura będzie miała większy obszar bliski zeru. Dla wszystkich pokazanych dodatnich wartości procedura ta jest procedurą Stouffera.μ
Kod R.
Obejmuje to metodę Fishera (skomentowaną) do porównania.
źródło
R
symulację, aby to przetestować. Byłby to dobry sposób na zapoznanie się z tą statystyczną platformą obliczeniową. :-)Jednym z ogólnych sposobów na uzyskanie wglądu w statystyki testowe jest wyprowadzenie (zwykle domyślnych) podstawowych założeń, które doprowadziłyby do tego, że statystyka testowa jest najsilniejsza. W tym konkretnym przypadku student i ja niedawno to zrobiliśmy: http://arxiv.org/abs/1111.1210v2 (poprawiona wersja pojawi się w Annals of Applied Statistics).
Bardzo krótko streszczając (i zgodnie z wynikami symulacji w innej odpowiedzi) metoda Stouffera będzie najsilniejsza, gdy „prawdziwe” podstawowe efekty będą równe; suma Z ^ 2 będzie najsilniejsza, gdy podstawowe efekty są normalnie rozmieszczone około 0. Jest to niewielkie uproszczenie, które pomija szczegóły: więcej informacji można znaleźć w sekcji 2.5 przedruku arxiv połączonego powyżej.
źródło
Nieznacznie o / t: jednym z problemów w obu tych podejściach jest utrata mocy z powodu stopni swobody (N dla stouffera; 2N dla Fishera). Opracowano w tym celu lepsze podejścia metaanalityczne, które warto rozważyć (na przykład metaanaliza ważona odwrotnością wariancji).
Jeśli szukasz dowodów na alternatywne testy w grupie, możesz spojrzeć na statystyki dotyczące większej krytyki Donoho i Jina: https://projecteuclid.org/euclid.aos/1085408492
źródło
Aby odpowiedzieć na pytanie i dla dalszych czytelników: czy kiedykolwiek był używany ?, istnieje wyczerpujący artykuł Cousins (2008) na temat arXiv, w którym wymieniono i oceniono kilka alternatywnych podejść. Proponowany wydaje się nie pojawiać.
źródło