Jak powinienem modelować interakcje między zmiennymi objaśniającymi, gdy jedna z nich może mieć wyrażenia kwadratowe i sześcienne?

Mam szczerą nadzieję, że sformułowałem to pytanie w taki sposób, że można na nie ostatecznie odpowiedzieć - jeśli nie, proszę dać mi znać, a spróbuję ponownie! Powinienem też chyba zauważyć, że do tych analiz będę używać R.

Mam kilka środków, plant performance (Ys)które, jak podejrzewam, były pod wpływem czterech zabiegów, które nałożyłem flower thinning (X1), fertilization (X2), leaf clipping (X3)- i biased flower thinning (X4). Dla wszystkich możliwych Y, N wynosi co najmniej 242, więc moje próbki były duże. Wszystkie wykresy były albo przerzedzone, albo nie, ale każdy wykres został również poddany jednemu (i tylko jednemu) z pozostałych trzech zabiegów (lub nie - były również wykresy kontrolne). Ideą tego projektu było sprawdzenie, czy pozostałe trzy zabiegi były w stanie „maskować” lub „wzmacniać” efekty przerzedzania. Zatem z założenia trzy ostatnie zabiegi (X2-X4) nie mogły ze sobą współdziałać, ponieważ nie zostały skrzyżowane, ale każde z nich może oddziaływać z przerzedzaniem kwiatów - i prawdopodobnie tak jest.

Moje wyraźne hipotezy są następujące: 1) przerzedzenie kwitnienia będzie znaczące i 2) warunki interakcji X1*X2, X1*X3, and X1*X4,między przerzedzeniem kwiatów a pozostałymi trzema zabiegami będą również znaczące. Oznacza to, że przerzedzanie kwiatów powinno mieć znaczenie, ale sposoby, w jakie to ma znaczenie, powinny zostać znacząco zmienione przez to, co zrobiły pozostałe trzy zabiegi.

Chciałbym zawrzeć wszystkie te informacje w modelu mieszanym:

Y ~ X0 + X1 + X2 + X3 + X4 + X1*X2 + X1*X3 + X1*X4 + (Up to three random effects)

Jest jednak jedno rozłączenie: mam dobry powód, by sądzić, że skutki przerzedzenia Y są nieliniowe. Są prawdopodobnie kwadratowe, ale w niektórych przypadkach nawet sześcienne. Wynika to z faktu, że wpływ przerzedzania na wydajność najprawdopodobniej wzrośnie szybciej przy wyższych poziomach przerzedzania. Jeśli spróbuję zamodelować tę nieliniową zależność za pomocą powyższego równania, dodając warunki kwadratowe i sześcienne dla X1, nie jestem pewien, jak modelować warunki interakcji - czy powinienem uwzględnić każdą możliwą kombinację X1, (X1) ^ 2 i (X1) ^ 3 * X2, X3 i X4? Ponieważ wydaje się, że to wiele parametrów, które próbuję oszacować, nawet przy liczbie punktów danych, które mam, i nie jestem pewien, jak interpretować otrzymane wyniki. To powiedziawszy, nie mam biologicznego powodu, aby sądzić, że byłby to nieroztropny sposób modelowania sytuacji.

Mam trzy przemyślenia na temat rozwiązania tego problemu:

Najpierw dopasuj mniejszy model, np Y ~ X1 + X1^2 + X^3 + Random effects. Wyłącznie w celu ustalenia, czy związek między przerzedzeniem a Y jest liniowy, kwadratowy lub sześcienny, a następnie przekształć przerzedzenie za pomocą pierwiastka kwadratowego lub sześcianu, aby odpowiednio zlinearyzować związek. Stamtąd terminy interakcji można modelować jak powyżej za pomocą przekształconej zmiennej.

Załóż, że znaczące interakcje, jeśli wystąpią, wpływają tylko na jeden z terminów X1 (tj. Tylko liniowy, kwadratowy lub sześcienny) i odpowiednio modeluj interakcje. Nie jestem nawet pewien, czy to podejście ma sens.

Po prostu dopasuj „pełny model” do każdego możliwego terminu interakcji między warunkami przerzedzania a innymi metodami leczenia, jak omówiono powyżej. Następnie wytnij nieistotne terminy interakcji i użyj wykresów i innych technik do interpretacji wyników.

Które z tych podejść, jeśli w ogóle, ma sens i dlaczego, biorąc pod uwagę, że jestem zainteresowany testowaniem hipotez, a nie wyborem modelu? W szczególności, jeśli powyższy punkt 1 nie ma sensu, dlaczego? Przeczytałem ten artykuł i ten artykuł i próbowałem przetrawić, co mogą dla mnie oznaczać, ale wszelkie źródła do dalszej lektury również byłyby mile widziane!

hypothesis-testing mixed-model interaction nonlinear regression-strategies Bajcz
źródło

Odpowiedzi:

Żadne z tych podejść nie będzie działać poprawnie. Podejście 3. zbliżyło się, ale wtedy powiedziałeś, że przycinasz nieistotne warunki. Jest to problematyczne, ponieważ współliniowości uniemożliwiają znalezienie terminów do usunięcia, a ponieważ dałoby to zły stopień swobody w testach hipotez, jeśli chcemy zachować błąd typu I.

W zależności od efektywnej wielkości próbki i stosunku sygnału do szumu w twoim problemie sugerowałbym dopasowanie modelu do wszystkich warunków produktu i głównego efektu oraz interpretację modelu przy użyciu wykresów i „testów porcji” (wiele testów df powiązanych terminów, tj. test na ogólną interakcję, test na nieliniową interakcję, test na ogólny efekt, w tym efekt główny + interakcja itp.). rmsPakiet R ułatwia to w przypadku standardowych modeli jednowymiarowych i modeli podłużnych, gdy $Y$ jest normalna na wielu odmianach. Przykład:

# Fit a model with splines in x1 and x2 and tensor spline interaction surface
# for the two.  Model is additive and linear in x3.
# Note that splines typically fit better than ordinary polynomials
f <- ols(y ~ rcs(x1, 4) * rcs(x2, 4) + x3)
anova(f)   # get all meaningful hypothesis tests that can be inferred
           # from the model formula
bplot(Predict(f, x1, x2))    # show joint effects
plot(Predict(f, x1, x2=3))   # vary x1 and hold x2 constant

Gdy zobaczysz anovatabelę, zobaczysz oznaczone linie, All Interactionsktóre dla całego modelu testują łączny wpływ wszystkich warunków interakcji. W przypadku pojedynczego predyktora jest to pomocne tylko wtedy, gdy predyktor oddziałuje z więcej niż jedną zmienną. W printmetodzie jest opcja anova.rmspokazania dokładnie każdego wiersza w tabeli, które parametry są testowane względem zera. Wszystko to działa z mieszaninami predyktorów jakościowych i ciągłych.

Jeśli chcesz użyć zwykłych wielomianów, użyj polzamiast rcs.

Niestety nie wdrożyłem modeli efektów mieszanych.

Frank Harrell
źródło

Dziękuję za tę odpowiedź. Nigdy wcześniej nie używałem splajnów, ale myślę, że rozumiem twój przykład. Mam kilka dalszych pytań, jeśli to w porządku? 1. Patrząc na wyniki anova z ols, jak w twoim przykładzie, co oznacza „wszystkie interakcje” pod czynnikiem? Czyli wszystkie interakcje z czym? 2. Czy podobne podejście będzie dopuszczalne w podejściu modelowania mieszanego? Myślę, że utknąłem z potrzebowaniem losowych czynników. Czy twój przykład jest zgodny na przykład z lme4? 3. Czy to zadziała, jeśli niektóre z interakcyjnych metod leczenia są kategoryczne? Na przykład, co jeśli X2 byłby czynnikiem 2-poziomowym?

Bajcz

Jestem fanem stosowania nieparametrycznych regresji wygładzania do oceny form funkcjonalnych zależności między zmiennymi zależnymi i predyktorami, nawet gdy później zamierzam oszacować modele regresji parametrycznej. Chociaż bardzo często znajdowałem relacje nieliniowe, nigdy nie znalazłem terminu interakcji nieliniowej, nawet jeśli główne efekty są silnie nieliniowe. Mój dom: efekty interakcji nie muszą składać się z tych samych form funkcjonalnych co predyktory, z których się składają.

Alexis
źródło

Tak więc, aby wyjaśnić, zabierasz do domu, że jeśli wybiorę opcję nr 2, mogę bezpiecznie po prostu dołączyć warunki interakcji z liniowym terminem X1 i nie martwić się o „warunki interakcji wyższego rzędu”, np. X1 ^ 2 * X3 i tak dalej?

Bajcz

@Bajcz Cóż ... Chyba mówię dwie rzeczy: (1) udało mi się przetrwać w zestawach danych, które napotkałem przy interakcjach tylko liniowych, ale także (2) Lubię patrzeć (używając regresji nieparametrycznych) i niech dane powiedzą mi, czy powinienem rozważyć nieliniowe alternatywy. [Przyjmowanie modelowego podejścia do testowania dopasowania lub hipotezy do terminów nieliniowych jest niewłaściwą metodą IMO, ponieważ wymaga to na przykład wnioskowania na podstawie, na przykład, dowolnego zestawu wielomianów, a nie samych danych.]

Alexis,

Nie ma dużego powodu, aby sądzić, że interakcje są bardziej liniowe. Natrafiłem na świetne przykłady interakcji nieliniowych. Pomysł „patrzenia” i „informowania cię o tym” jest obalony problemami wnioskowania, w tym problemami z pokryciem przedziału ufności.

Frank Harrell,

@FrankHarrell Dziękujemy! Twoje pierwsze zdanie jest dokładnie tym, o czym starałem się dotrzeć w moim (2) w powyższym komentarzu (moje wcześniejsze doświadczenia mogą się znacznie różnić w przyszłości). OTOH: nie pozwalanie na mówienie danych jest świetną strategią przypisywania wnioskowania na temat artefaktów założeń modelowania do wnioskowania na temat rzeczywistych danych.

Alexis,