Jak mogę uzyskać znaczącą ogólną ANOVA, ale bez istotnych różnic par w procedurze Tukeya?

18

Wystąpiłem z AN ANĄ R i dostałem znaczące różnice. Jednak podczas sprawdzania, które pary były znacząco różne za pomocą procedury Tukeya, nie dostałem żadnej z nich. Jak to możliwe?

Oto kod:

fit5_snow<- lm(Response ~ Stimulus, data=audio_snow)
anova(fit5_snow)

> anova(fit5_snow)
Analysis of Variance Table

Response: Response
          Df Sum Sq Mean Sq F value  Pr(>F)  
Stimulus   5  73.79 14.7578  2.6308 0.02929 *
Residuals 84 471.20  5.6095                  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 

df<-df.residual(fit5_snow)
MSerror<-deviance(fit5_snow)/df

comparison <-  HSD.test(audio_snow$Response, audio_snow$Stimulus, df, MSerror, group=FALSE)

> comparison <-  HSD.test(audio_snow$Response, audio_snow$Stimulus, df, MSerror, group=FALSE)

Study:

HSD Test for audio_snow$Response 

Mean Square Error:  5.609524 

audio_snow$Stimulus,  means

                audio_snow.Response   std.err replication
snow_dry_leaves            4.933333 0.6208034          15
snow_gravel                6.866667 0.5679258          15
snow_metal                 6.333333 0.5662463          15
snow_sand                  6.733333 0.5114561          15
snow_snow                  7.333333 0.5989409          15
snow_wood                  5.066667 0.7713110          15

alpha: 0.05 ; Df Error: 84 
Critical Value of Studentized Range: 4.124617 

Comparison between treatments means

                              Difference   pvalue sig        LCL      UCL
snow_gravel - snow_dry_leaves  1.9333333 0.232848     -0.5889913 4.455658
snow_metal - snow_dry_leaves   1.4000000 0.588616     -1.1223246 3.922325
snow_sand - snow_dry_leaves    1.8000000 0.307012     -0.7223246 4.322325
snow_snow - snow_dry_leaves    2.4000000 0.071587   . -0.1223246 4.922325
snow_wood - snow_dry_leaves    0.1333333 0.999987     -2.3889913 2.655658
snow_gravel - snow_metal       0.5333333 0.989528     -1.9889913 3.055658
snow_gravel - snow_sand        0.1333333 0.999987     -2.3889913 2.655658
snow_snow - snow_gravel        0.4666667 0.994348     -2.0556579 2.988991
snow_gravel - snow_wood        1.8000000 0.307012     -0.7223246 4.322325
snow_sand - snow_metal         0.4000000 0.997266     -2.1223246 2.922325
snow_snow - snow_metal         1.0000000 0.855987     -1.5223246 3.522325
snow_metal - snow_wood         1.2666667 0.687424     -1.2556579 3.788991
snow_snow - snow_sand          0.6000000 0.982179     -1.9223246 3.122325
snow_sand - snow_wood          1.6666667 0.393171     -0.8556579 4.188991
snow_snow - snow_wood          2.2666667 0.103505     -0.2556579 4.788991
L_T
źródło
Czy możesz podać dane?
ttnphns
1
Znalazłem odpowiedź na to późniejsze pytanie stats.stackexchange.com/questions/74174/… (oznaczone jako duplikowanie tego wątku) szczególnie pomocne.
ameba mówi Przywróć Monikę

Odpowiedzi:

2

Dlaczego to nie powinno być możliwe?

Test ogólny i testy parami zadają różne pytania, aby uzyskać różne odpowiedzi.

Peter Flom - Przywróć Monikę
źródło
1
Czy mógłbyś powiedzieć coś więcej?
rolando2,
2
Ogólna ANOVA zadaje pytanie o całą zmienną niezależną i jej związek (lub jej brak) ze zmienną zależną. Porównania parami pytają o różnice między parami. Następnie wartość p patrzy na sig statystyczny. każdego z nich, z parą skorygowaną dla wielu porównań (w tym przypadku przy użyciu metod HSD Tukeya).
Peter Flom - Przywróć Monikę
1
dzięki Peter. Być może mniej zadają „inne pytania”, a więcej korekty dla wielu porównań, które uwzględniają inny wynik.
rolando2,
17

Wynika to głównie z czułości ANOVA (większej niż czułość testu parami). Następnie ANOVA wykrywa niższą zmienność wokół średniej, gdy test parowy ledwo rozróżnia średnią między parą. Analiza musi koncentrować się na różnicach, a Ty możesz być bardziej elastyczny w analizie post-hoc, pamiętając, że właśnie zauważyłeś, że istnieją różnice w średniej. Pamiętaj, aby sprawdzić założenia ANOVA.

Z drugiej strony istnieją pewne tematy dotyczące stosowania testu parami bez użycia ANOVA: Czy potrzebujemy testu globalnego przed testami post hoc?

Jose Zubcoff
źródło
Zdecydowanie nie trzeba przeprowadzać globalnego testu przed porównaniem HSD Tukeya, ponieważ HSD kontroluje współczynnik błędów typu I. Nienawidzę jednak nazywać ich post-hocami, ponieważ należy je planować z góry.
David Lane