Załóżmy, że mam eksperyment z dwoma lub więcej czynnikami. Konstruowana jest ogólna ANOVA, a następnie przeprowadzamy kolejne dwa lub więcej zestawów testów post hoc , powiedzmy wiele porównań. Moje pytanie dotyczy tego, jak duże --- i ile --- rodzin powinno być wykorzystane jako podstawa do dopasowania mnogości tych testów post hoc .
Przykładem jest zestaw danych dotyczących łamania osnowy z książki Tukeya na temat EDA. Istnieją dwa czynniki: wool
(na dwóch poziomach) i tension
(na trzech poziomach). Tabela ANOVA to:
Source Df Sum Sq Mean Sq F value Pr(>F)
wool 1 450.7 450.67 3.7653 0.0582130
tension 2 2034.3 1017.13 8.4980 0.0006926
wool:tension 2 1002.8 501.39 4.1891 0.0210442
Residuals 48 5745.1 119.69
Oczywiście w modelu potrzebna jest interakcja. Postanawiamy więc dokonać porównania poziomów każdego czynnika, utrzymując drugi czynnik stały. Wyniki są poniżej, z kilkoma adnotacjami, do których można się później odwołać:
*** Pairwise comparisons of tension for each wool ***
*** All combined: Family T ***
wool = A: *** Family T|A ***
contrast estimate SE df t.ratio
L - M 20.5555556 5.157299 48 3.986
L - H 20.0000000 5.157299 48 3.878
M - H -0.5555556 5.157299 48 -0.108
wool = B: *** Family T|B ***
contrast estimate SE df t.ratio
L - M -0.5555556 5.157299 48 -0.108
L - H 9.4444444 5.157299 48 1.831
M - H 10.0000000 5.157299 48 1.939
*** Comparison of wool for each tension ***
*** All combined: Family W ***
tension = L: *** Family W|L ***
contrast estimate SE df t.ratio
A - B 16.333333 5.157299 48 3.167
tension = M: *** Family W|M ***
contrast estimate SE df t.ratio
A - B -4.777778 5.157299 48 -0.926
tension = H: *** Family W|H ***
contrast estimate SE df t.ratio
A - B 5.777778 5.157299 48 1.120
Myślę, że istnieją różne praktyki i zastanawiam się, które są najczęstsze i jakie argumenty ludzie przemawiają za lub przeciw każdemu podejściu. W obliczeniach dostosowany wartości, czy powinniśmy dokonać korekty krotności dla ...
- każda z pięciu najmniejszych rodzin (T | A, T | B, ..., W | H) oddzielnie? (Uwaga - ostatnie 3 rodziny mają tylko jeden test, więc nie będzie dla nich korekty wielokrotności)
- każda z większych rodzin (T, z 6 testami i W, z 3 testami) oddzielnie?
- wszystko testy uważane za jedną dużą rodzinę?
Interesuje mnie zarówno to, co zwykle robią ludzie (nawet jeśli nie myśleli o tym dużo), a także dlaczego (jeśli mają). Kilka rzeczy, o których mógłbym wspomnieć to:
- Jest 3 testy w tabeli ANOVA. Nie przypominam sobie, aby ktoś rozważał korektę wielokrotności w testach ANOVA. Jeśli tak jest i polecasz opcję (3), czy jesteś niespójny?
- Gdybyśmy przeprowadzili nieco mniejszy eksperyment, w którym wszystkie testy są mniej wydajne, możliwe jest, że interakcja nie byłaby znacząca, prowadząc do znacznie mniejszej liczby porównań post hoc jedynie środków marginalnych. Ponadto, środki krańcowe mogłyby równie dobrze mieć mniejsze SE niż środki komórkowe w większym eksperymencie. Jeśli ponadto dostosowanie wielokrotności jest mniej konserwatywne, moglibyśmy uzyskać więcej „znaczących” wyników przy mniejszej ilości danych niż przy większej liczbie danych.
Chcesz zobaczyć, co ludzie mają do powiedzenia ...
źródło
lsmeans
? To było dużo pracy dla tego pytania!