Jeśli jakikolwiek test parametryczny nie odrzuca wartości zerowej, czy jego nieparametryczna alternatywa robi to samo?

12

Jeśli zakłada się, że testy nieparametryczne mają mniejszą moc niż ich alternatywy parametryczne, czy to oznacza, że ​​jeśli jakikolwiek test parametryczny nie odrzuca wartości zerowej, to jego nieparametryczna alternatywa również nie odrzuca wartości zerowej? Jak to zmienić, jeśli założenia testu parametrycznego nie zostaną spełnione, a test i tak zostanie zastosowany?

Miroslav Sabo
źródło
4
(a) jeśli test A ma niższą moc niż test B w pewnych zakładanych okolicznościach, nie oznacza to, że przypadki, które A odrzuci, są podzbiorem przypadków w B (w rzeczywistości nie jest to możliwe przy ustalonym poziomie istotności); odrzucają różne (ale być może mocno pokrywające się) fragmenty przestrzeni próbki - zawsze są przypadki, w których każda odrzuca to, czego nie zrobi druga. (b) Jeśli założenia testu parametrycznego nie są spełnione (czy rzeczywiście są spełnione?), to testy parametryczne mogą mieć stosunkowo słabą moc (np. test t vs Mann-Whitney pod ciężkimi ogonami)
Glen_b -Reinstate Monica

Odpowiedzi:

9

Jeśli test parametryczny nie odrzuci hipotezy zerowej, wówczas jej nieparametryczny odpowiednik może zdecydowanie odrzucić hipotezę zerową. Jak powiedział @John, dzieje się to zwykle wtedy, gdy naruszane są założenia uzasadniające zastosowanie testu parametrycznego. Na przykład, jeśli porównamy test t dla dwóch próbek z testem sumy rang Wilcoxona, możemy doprowadzić do takiej sytuacji, jeśli uwzględnimy wartości odstające w naszych danych (z wartościami odstającymi nie powinniśmy używać testu dwóch próbek).

#Test Data
x = c(-100,-100,rnorm(1000,0.5,1),100,100)
y = rnorm(1000,0.6,1)

#Two-Sample t-Test
t.test(x,y,var.equal=TRUE)

#Wilcoxon Rank Sum Test
wilcox.test(x,y)

Wyniki uruchomienia testu:

> t.test(x,y,var.equal=TRUE)

    Two Sample t-test

data:  x and y 
t = -1.0178, df = 2002, p-value = 0.3089
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 -0.6093287  0.1929563 
sample estimates:
mean of x mean of y 
0.4295556 0.6377417 

> 
> wilcox.test(x,y)

    Wilcoxon rank sum test with continuity correction

data:  x and y 
W = 443175, p-value = 5.578e-06
alternative hypothesis: true location shift is not equal to 0 

źródło
9

Nie.

Chociaż testy parametryczne mogą być mocniejsze, nie zawsze tak jest. Kiedy tak nie jest, zwykle dzieje się tak, gdy nie powinieneś przeprowadzać testów parametrycznych.

Ale nawet jeśli zbierasz próbki o przyzwoitych rozmiarach z normalnych rozkładów z jednakową wariancją, w których test parametryczny ma większą moc, nie gwarantuje to, że dla każdego konkretnego eksperymentu nieistotny test parametryczny oznacza nieistotny test nieparametryczny. Oto symulacja, która wykorzystuje losowe próbkowanie z rozkładów normalnych i stwierdza, że ​​około 1,8% czasu, gdy p> 0,05 dla testu t, a p <0,05 dla testu Wilcoxona.

nsim <- 10000
n <- 50
cohensD <- 0.2
Y <- replicate(nsim, {
    y1 <- rnorm(n, 0, 1); y2 <- rnorm(n, cohensD, 1)
    tt <- t.test(y1, y2, var.equal = TRUE)
    wt <- wilcox.test(y1, y2)
    c(tt$p.value, wt$p.value)})
sum(Y[1,] > 0.05 & Y[2,] < 0.05) / nsim

Można zauważyć, że w tej symulacji moc testu parametrycznego jest większa niż testu nieparametrycznego (chociaż są one podobne).

sum(Y[1,] < 0.05) / nsim #t-test power
sum(Y[2,] < 0.05) / nsim #wilcox.test power

Ale, jak pokazano powyżej, nie oznacza to, że we wszystkich przypadkach, w których test parametryczny nie znajdzie skutku, test nieparametryczny również się nie powiedzie.

Możesz grać w tę symulację. Zrób n dość duże, powiedzmy 1000, i zmniejsz rozmiar efektu, powiedzmy 0,02 (potrzebujesz małej mocy, aby mieć dużo próbek, w których test się nie powiedzie). Możesz mieć prawie całkowitą gwarancję, że n wynosi 1000, że żadna próbka nie zostanie odrzucona z powodu nienormalności (przez inspekcję, a nie głupi test) lub nie będziesz mieć podejrzanych wartości odstających. Mimo to niektóre testy parametryczne okazują się nieistotne, podczas gdy testy nieparametryczne są znaczące.

Możesz także spojrzeć na Hunter i May (1993).

Hunter, MA, i May, RB (1993). Kilka mitów dotyczących testów parametrycznych i nieparametrycznych. Canadian Psychology, 34 (4), 384–389.

Jan
źródło