Post-hocs dla testów przedmiotowych?

20

Jaka jest preferowana metoda przeprowadzania post-hoców w ramach testów przedmiotowych? Widziałem opublikowane prace, w których stosuje się HSD Tukeya, ale przegląd Keppela i Maxwella i Delaneya sugeruje, że prawdopodobne naruszenie kulistości w tych projektach powoduje, że termin błędu jest niepoprawny, a takie podejście jest problematyczne. Maxwell i Delaney podają podejście do problemu w swojej książce, ale nigdy nie widziałem, aby było tak w żadnym pakiecie statystyk. Czy oferowane przez nich podejście jest odpowiednie? Czy poprawność Bonferroniego lub Sidaka w testach t dla wielu sparowanych próbek byłaby uzasadniona? Dopuszczalna odpowiedź zapewni ogólny kod R, który może przeprowadzać post-hoki na prostych, wielostronnych i mieszanych projektach wytworzonych przez ezANOVAfunkcję w ezpakiecie, oraz odpowiednie cytaty, które prawdopodobnie przejdą z recenzentami.

russellpierce
źródło
1
W tym artykule Davida Howella wyjaśniono problemy i kilka rozwiązań.
Harvey Motulsky
skoro zaakceptowałeś odpowiedź przy użyciu pakietu multcomp, czy mógłbyś trochę wyjaśnić, jak w końcu użyłeś multcomp. Używasz go z lmelub lmerfunkcji lub z niektórych bardziej tradycyjnych metod, jak t-testu lub ANOVA (jak jestem obecnie próbuje użyć go ANOVA).
Henrik
Zaakceptowałem odpowiedź multcomp przede wszystkim dlatego, że jestem całkowicie niezadowolony z technik dostosowywania wartości p, które społeczność wybrała jako „właściwą” odpowiedź. Spojrzałem na to i wydawało się to obiecujące, ale nie badałem dalej. Chciałbym dowiedzieć się więcej o tym, czego próbujesz i czego się dowiadujesz.
russellpierce
Znalazłem sposób na określenie ANOVA z powtarzanymi pomiarami lme, patrz komentarze do zaakceptowanej odpowiedzi: stats.stackexchange.com/q/14088/442 Za pomocą obiektu klasy lmemożna użyć multcompdo efektów wewnątrz podmiotu. Oferuje różne rodzaje korekcji błędów alfa, ale głównie te, które nie są specjalnie lubiane (jak ten, który zaproponowałem, który został uznany przez społeczność za „właściwy”). Oprócz winiety jest też książka, multcompktóra wyjaśnia wszystkie metody. Jeśli chcesz post-hoców bez regulacji, użyj albo fit.contrastz gmodelnowego contrastpakietu.
Henrik
Czy nadal jesteś zainteresowany rozwiązaniem tej ezANOVAfunkcji? Jeśli tak, myślę, że mogę odpowiedzieć na to pytanie, ale A opierałby się na testach dla modeli jednowymiarowych, dla których sferyczność jest krytycznym założeniem. Jeśli nie potrzebujesz ograniczenia A do obliczeń ANOVA ezpakietu, mógłbym podać A, który używa modeli wielowymiarowych do testów post-hoc.
statmerkur

Odpowiedzi:

21

Obecnie piszę artykuł, w którym mam przyjemność przeprowadzać porównania między przedmiotami i pomiędzy nimi. Po dyskusji z moim przełożonym postanowiliśmy przeprowadzić testy- t i użyć dość prostej Holm-Bonferroni method( wikipedia ) do korekty kumulacji błędu alfa. Kontroluje rodzinny poziom błędu, ale ma większą moc niż zwykła procedura Bonferroniego. Procedura:

  1. Uruchamiasz t testy dla wszystkich porównań, które chcesz wykonać.
  2. Zamawiasz p -values według ich wartości.
  3. Testujesz najmniejszą wartość p względem alfa / k , drugą najmniejszą przeciwko alfa / ( k - 1) i tak dalej, dopóki pierwszy test nie okaże się nieistotny w tej sekwencji testów.

Cite Holm (1979), który można pobrać przez link na wikipedii .

Henrik
źródło
1
może ANOVA przed wieloma testami?
stan
2
Myślę, że wynikało to z odpowiedzi. Wykonujesz testy post-hoc po znaczącej ANOVA.
Henrik
2
@Henrik: Mam nadzieję, że nie biję tutaj martwego konia ... publikując stary post. Mam więc pytanie dotyczące sposobu przeprowadzenia testów t. Czy użyłeś wariancji zbiorczej (z ANOVA) czy po prostu wykonałeś niezależne testy t pary? Powodem, dla którego o to pytam, jest to, że próbowałem użyć pairwise.t.test()porównań parami przy użyciu metody Bonferroni lub Holm-Bonf, ale wyniki różnią się drastycznie w zależności od tego, czy używam puli SD, czy traktuję każde porównanie jako osobne, niezależne t -test. Dzięki!
Alex
2
@Alex: zastosowanie podejścia „chronionego”, w którym testy t są przeprowadzane dopiero po znaczącej ANOVA implikuje użycie połączonego terminu błędu. Ponieważ jednak nie jest to opcja często oferowana przez oprogramowanie statystyczne, ludzie zwykle tego nie robią. Co więcej, w zakresie, w jakim naruszona jest sferyczność, jest to przede wszystkim wątpliwe.
russellpierce
5

Pamiętam trochę dyskusji na ten temat w przeszłości; Nie znam żadnej implementacji podejścia Maxwella i Delaneya, chociaż nie powinno to być zbyt trudne. Spójrz na „ ANOVA z powtarzanymi pomiarami za pomocą R ”, która pokazuje także jedną metodę rozwiązania problemu sferyczności w HSD Tukeya .

Możesz również znaleźć ten opis testu zainteresowań Friedmana .

Shane
źródło
Dzięki, myślę, że test Friedmana jest interesujący, ale nie mogę do końca zrozumieć, jak to robi korekta błędu typu I w post-hoc. Komentarze mówią, że jest to „test Wilcoxona-Nemenyi-McDonald-Thompson”, ale nigdy o tym nie słyszałem, czy mógłbyś to wyjaśnić?
russellpierce
@Shane Pierwszy link nie działa :-(
Adam Ryczkowski
2

Istnieją dwa warianty wnioskowania testów F w SPSS. Wielowymiarowy NIE zakłada sferyczności, więc adn wykorzystuje inną korelację par dla każdej pary zmiennych. „Testy efektów wewnątrz badanych”, w tym wszelkie testy post hoc, zakładają sferyczność i wprowadzają pewne poprawki do stosowania wspólnej korelacji we wszystkich testach. Procedury te są dziedzictwem czasów, w których obliczenia były drogie i są stratą czasu w przypadku nowoczesnych urządzeń komputerowych.

Moje zalecenie to wzięcie omnibusa MULTIVARIATE F do wszelkich powtarzanych działań. Następnie kontynuuj testem post hoc parą t lub ANOVA z tylko 2 poziomami w każdym porównaniu z powtarzanymi pomiarami, jeśli występują również między czynnikami podmiotowymi. Zrobiłbym prostą poprawkę bon ferroni dzielącą poziom alfa przez liczbę testów.

Pamiętaj również, aby spojrzeć na rozmiar efektu [dostępny w oknie dialogowym opcji]. Duże rozmiary efektów, które są „zbliżone” do znaczących, mogą być bardziej warte uwagi [i przyszłych eksperymentów] niż małe, ale znaczące efekty.

Bardziej wyrafinowane podejście jest dostępne w procedurze SPSS MIESZANE, a także w mniej przyjaznych dla użytkownika [ale wolnych] pakietach, takich jak R.

Podsumowanie, w SPSSS, wielowymiarowa F, po której następują pary post hocs z Bon Ferroniwith Bonferroni, powinny być wystarczające dla większości potrzeb.


źródło
0

Będę używał funkcji R qtukey (1-alfa, znaczy, df), aby stworzyć CI dla rodziny.

tukey0.05,4,16

MSErrorTukeyk,df=Maxj=1,2,,k{zj}Minj=1,2,,k{zj}χdf2/df=Rangej=1,2,,k{MjμjσM}SEM/σM=Rangej=1,2,,k{Mjμj}SEM=Max1j1,j2k{|(Mj1μj1)(Mj2μj2)|}SEM=Max1j1,j2k{|(Mj1Mj2)(μj1μj2)|}SEM

The radius of family-wise 1-α CIs is SEM×tukeyα,4,16=MSError5×tukeyα,4,16 because--

{Tukeyk,dftukey0.05,4,16}={Max1j1,j2k{|(Mj1Mj2)(μj1μj2)|}SEMtukey.05,4,16}=1j1,j2k{|(Mj1Mj2)(μj1μj2)|SEM×tukey.05,4,16}

Given a within-subject design with k=4 levels, 17 sample size e.g. (17-1)=16 df for MSError, and Xi,j=(μj+vi)+εi,j=X~i,j+εi,j, the radius of family-wise (1-α) CIs is MSError/17×tukeyα,4,16 because--

Tukeyk,df=Maxj=1,2,,k{zj}Minj=1,2,,k{zj}χdf2/df=Rangej=1,2,,k{Mean1in{X~i,j+εi,j}Mean1in{X~i,j}σMean1in{εi,j}}σ^Mean1in{εi,j}/σMean1in{εi,j}=Rangej=1,2,,k{Mj(μj+Mean1in{vi})}σ^Mean1in{εi,j}=Rangej=1,2,,k{Mjμj}MSError/n=Max1j1,j2k{|(Mj1Mj2)(μj1μj2)|}MSError/n

Xiaoxu LI
źródło