Testy post hoc w ANCOVA

13

Pytanie: Jaka jest dobra metoda przeprowadzania testów post hoc różnic między średnimi grupowymi po skorygowaniu o efekt zmiennej towarzyszącej?

Przykład prototypowy:

  • Cztery grupy, 30 uczestników na grupę (np. Cztery różne populacje psychologii klinicznej)
  • Zmienna zależna jest liczbą (np. Wyniki wywiadu)
  • Współzmienna jest liczbą (np. Wskaźnik statusu społeczno-ekonomicznego)
  • Pytania badawcze dotyczą tego, czy jakakolwiek para grup różni się znacząco od zmiennej zależnej po kontrolowaniu dla zmiennej towarzyszącej

Powiązane pytania :

  • Jaka jest preferowana metoda?
  • Jakie implementacje są dostępne w R?
  • Czy istnieją jakieś ogólne odniesienia do tego, jak zmienna towarzysząca zmienia procedury przeprowadzania testów post hoc?
Jeromy Anglim
źródło
Możesz także przeczytać tutaj. stackoverflow.com/questions/23628323/…
James Holland

Odpowiedzi:

13

Testy wielokrotne po ANCOVA lub, bardziej ogólnie, dowolnym GLM, ale porównania koncentrują się teraz na skorygowanej grupie / leczeniu lub na marginalnych środkach (tj. Jakie byłyby wyniki, gdyby grupy nie różniły się względem kowariantu będącego przedmiotem zainteresowania). O ile wiem, stosowane są testy Tukey HSD i Scheffé. Oba są dość konserwatywne i będą miały tendencję do ograniczania poziomu błędu typu I. Ten ostatni jest preferowany w przypadku nierównej wielkości próbki w każdej grupie. Wydaje mi się, że pamiętam, że niektórzy używają również korekcji Sidaka na określonych kontrastach (gdy jest to oczywiście interesujące), ponieważ jest ona mniej konserwatywna niż korekcja Bonferroniego.

Takie testy są łatwo dostępne w multcomppakiecie R (patrz ?glht). Towarzysząca winieta zawiera przykład zastosowania w przypadku prostego modelu liniowego (sekcja 2), ale można ją rozszerzyć na dowolną inną formę modelu. Inne przykłady można znaleźć w HHpakietach (patrz ?MMC). Kilka pakietów MCP i procedur ponownego próbkowania (zalecane w przypadku silnych wnioskowania, ale opiera się na innym podejściu do korekty inflacji wskaźnika błędu typu I) jest również dostępnych w multtestpakiecie, za pośrednictwem Bioconductor , patrz odnośniki (3–4). Ostateczne odniesienie do wielokrotnego porównania jest książka tych samych autorów: Dudoit, S. i van der Laan, MJ, Multiple Testing Procedures with Applications to Genomics (Springer, 2008).

Odnośnik 2 wyjaśnił różnicę między MCP w ogólnym przypadku (ANOVA, praca z nieskorygowanymi środkami) a ANCOVA. Jest też kilka artykułów, których właściwie nie pamiętam, ale przyjrzę się im.

Inne przydatne odniesienia:

  1. Westfall, PH (1997). Wielokrotne testowanie ogólnych kontrastów przy użyciu logicznych przeciwwskazań i korelacji. JASA 92 : 299-306.
  2. Westfall, PH and Young, SS (1993) Wiele testów opartych na próbkowaniu, przykłady i metody korekty wartości p . John Wiley and Sons: New York.
  3. Pollard, KS, Dudoit, S. i van der Laan, MJ (2004). Wiele procedur testowych: R pakiet testowy i aplikacje do genomiki .
  4. Taylor, SL Lang, DT i Pollard, KS (2007). Ulepszenia multitestu pakietu testowego . Wiadomości R 7 (3) : 52–55.
  5. Bretz, F., Genz, A., i Hothorn, LA (2001). W sprawie dostępności numerycznej wielu procedur porównawczych. Biometrical Journal , 43 (5) : 645–656.
  6. Hothorn, T., Bretz, F., i Westfall, P. (2008). Jednoczesne wnioskowanie w ogólnych modelach parametrycznych . Departament Statystyki: Raporty techniczne, Nr. 19

Pierwsze dwa są wymienione w SAS PROC związane z MCP.

chl
źródło
3

To interesujące pytanie. Myślę, że trzeba być bardzo ostrożnym, ponieważ większość oprogramowania, które porównuje post hoc po ANCOVA, robi to ALE na nieskorygowanych środkach.

Test Bryana Paulsona Tukeya (BPT) jest zalecany do porównania parami na DOSTOSOWANYCH środkach, inną procedurą może być warunkowy test Tukeya Kramera.

AnastD
źródło
2

Łącząc proste metody, do których można łatwo uzyskać dostęp z R oraz ogólne zasady, wystarczy użyć HSD Tukeya. Termin błędu z ANCOVA zapewni termin błędu dla przedziałów ufności.

W kodzie R byłoby to ...

#set up some data for an ANCOVA
n <- 30; k <- 4
y <- rnorm(n*k)
a <- factor(rep(1:k, n))
cov <- y + rnorm(n*k)

#the model
m <- aov(y ~ cov + a)

#the test
TukeyHSD(m)

(zignoruj ​​błąd w wyniku, oznacza to po prostu, że zmienna towarzysząca nie została oceniona, co właśnie chcesz)

Daje to węższe przedziały ufności niż w przypadku uruchomienia modelu bez cov ... zgodnie z oczekiwaniami.

Można łatwo zastosować dowolną technikę post hoc, która opiera się na resztkach z modelu dla wariancji błędu.

Jan
źródło
0

Dlaczego sprawiasz sobie tyle kłopotów i wprawiasz w zakłopotanie?

Możesz skonsultować się z Andy Field's Discovering Statistics using SPSS (wydanie trzecie) str. 401-404.

Korzystając z funkcji kontrastów lub porównując opcję efektów głównych, możesz łatwo wykonać post hoc na skorygowanych środkach po uwzględnieniu zmiennej towarzyszącej.

Masood Siyyari
źródło