Jak interpretować główne efekty, gdy efekt interakcji nie jest znaczący?

21

Uruchomiłem uogólniony liniowy model mieszany w R i uwzględniłem efekt interakcji między dwoma predyktorami. Interakcja nie była znacząca, ale główne efekty (dwa predyktory) były oba. Teraz wiele przykładów z podręczników mówi mi, że jeśli istnieje znaczący efekt interakcji, głównych efektów nie można interpretować. Ale co jeśli twoja interakcja nie jest znacząca?

Czy mogę stwierdzić, że dwa predyktory mają wpływ na odpowiedź? A może lepiej jest uruchomić nowy model, w którym pomijam interakcję? Wolę tego nie robić, ponieważ musiałbym wtedy kontrolować wiele testów.

rozemarijn
źródło
tak, miałem na myśli nieistotne
rozemarijn
4
Jeśli jedna z tych odpowiedzi Ci odpowiada, być może możesz ją zaakceptować lub poprosić o wyjaśnienie.
conjugateprior
Jeśli interakcja nie jest znacząca, powinieneś ją upuścić i uruchomić regresję bez niej.
Aksakal

Odpowiedzi:

21

Trochę niggle

„Teraz wiele przykładów z podręczników mówi mi, że jeśli istnieje znaczący efekt interakcji, głównych efektów nie można interpretować”

Mam nadzieję, że to nieprawda. Powinny powiedzieć, że jeśli istnieje warunek interakcji, powiedzmy między X i Z, zwany XZ, wówczas interpretacja poszczególnych współczynników dla X i Z nie może być interpretowana w taki sam sposób, jak gdyby XZ nie był obecny. Zdecydowanie możesz to zinterpretować.

pytanie 2

Jeśli interakcja ma sens teoretyczny, nie ma powodu, aby jej nie pomijać, chyba że obawy dotyczące wydajności statystycznej z jakiegoś powodu zastępują obawy dotyczące błędnej specyfikacji i pozwalają na rozbieżność teorii i modelu.

Biorąc pod uwagę, że nie opuścił go, a następnie interpretuje swój model używając marginalne zmiany w taki sam sposób, jak gdyby były znaczące oddziaływanie. Dla odniesienia dołączam link do Brambor, Clark i Golder (2006), którzy wyjaśniają, jak interpretować modele interakcji i jak unikać typowych pułapek.

Pomyśl o tym w ten sposób: często masz zmienne kontrolne w modelu, które okazują się nieistotne, ale nie (lub nie powinieneś) wycinać ich przy pierwszym znaku brakujących gwiazd.

Pytanie 1

Pytasz, czy możesz „dojść do wniosku, że dwa predyktory mają wpływ na odpowiedź?” Najwyraźniej możesz, ale możesz też zrobić lepiej. W przypadku modelu z terminem interakcji można zgłosić, jaki wpływ dwa czynniki prognostyczne faktycznie mają na zmienną zależną (efekty krańcowe) w sposób, który jest obojętny czy oddziaływanie jest znaczące, a nawet obecne w modelu.

Dolna linia

Jeśli usuniesz interakcję, ponownie określasz model. Z wielu powodów może to być rozsądne, niektóre teoretyczne i statystyczne, ale ułatwienie interpretacji współczynników nie jest jednym z nich.

sprzężonyprior
źródło
2
Pewnie. A jeśli jesteś w R, możesz znaleźć pakiet effectsłatwiejszy niż przechodzenie przez matematykę, a także w celu uogólnienia na bardziej złożone modele.
conjugateprior
1
W dolnej linii zależy to, co rozumiesz przez „łatwiej”.
John
Dziękuję bardzo za referencje Brambor, Clark i Golder (2006)! Wyjaśnianie modeli interakcji jest bardzo rozsądne. Bardzo przydatne w zrozumieniu, w jaki sposób interpretować (lub NIE) współczynniki w takich modelach ... BTW, artykuł zawiera załącznik internetowy: Multiplicative Interaction Models , który stanowi bardzo przydatny przegląd dyskusji.
landroni
11

Jeśli chcesz bezwarunkowego efektu głównego, to tak, chcesz uruchomić nowy model bez terminu interakcji, ponieważ ten termin interakcji nie pozwala prawidłowo zobaczyć bezwarunkowych efektów głównych. Główne efekty obliczone z obecną interakcją różnią się od głównych efektów, ponieważ zwykle interpretuje się je w czegoś takiego jak ANOVA. Na przykład możliwe jest trywialne i nie sygnalizowane działanie, główne efekty nie będą widoczne, gdy oddziaływanie jest w modelu.

Załóżmy, że masz dwa predyktory, A i B. Gdy uwzględnisz termin interakcji, wielkość A może się różnić w zależności od B i odwrotnie. Podany współczynnik beta na wyjściu regresji dla A jest wtedy tylko jedną z wielu możliwych wartości. Domyślnie stosuje się współczynnik A w przypadku, gdy B wynosi 0, a warunek interakcji wynosi 0. Ale, gdy regresja jest tylko addytywna, A nie może zmieniać się w obrębie B, a otrzymujesz główny efekt A niezależnie od B. Mogą to być bardzo różne wartości, nawet jeśli interakcja jest trywialna, ponieważ oznaczają różne rzeczy. Model addytywny jest jedynym sposobem, aby naprawdę samodzielnie ocenić główny efekt. Z drugiej strony, gdy twoja interakcja jest znacząca (teoretycznie nie statystycznie) i chcesz zachować to w swoim modelu, wtedy jedynym sposobem oceny A jest spojrzenie na to na poziomach B. W rzeczywistości należy rozważyć to w odniesieniu do interakcji, a nie to, czy A jest znaczące. Naprawdę widać tylko, czy w modelu addytywnym występuje bezwarunkowy wpływ A.

Dlatego modele patrzą na bardzo różne rzeczy i nie jest to kwestia wielokrotnych testów. Państwo musi patrzeć na to w obie strony. Nie decydujesz na podstawie znaczenia. Najlepszy główny efekt do zgłoszenia pochodzi z modelu addytywnego. Podejmujesz decyzję o włączeniu lub prezentacji nieistotnej interakcji na podstawie zagadnień teoretycznych lub problemów z prezentacją danych itp.

(Nie oznacza to, że nie ma tutaj potencjalnych potencjalnych problemów z wielokrotnym testowaniem. Ale to, co one oznaczają, zależy w dużej mierze od teorii przeprowadzającej testy).

Jan
źródło
Myślę, że troską @ rozemarijn jest bardziej „wyprawa na ryby”, tj. Uruchamianie wielu modeli, które różnią się funkcją tego, jak wypadły gwiazdy ostatniego, a nie wielokrotne testowanie w sensie technicznym
sprzężonyprior
1
Możesz uruchomić wszystkie modele, które chcesz. Samo obliczanie modelu nie jest testem. Test jest procedurą logiczną, a nie matematyczną. Fakt, że wiele programów domyślnie zwraca wartości p dla oszacowań parametrów tak, jakbyś przeprowadził jakiś test, nie oznacza, że ​​taki był.
John
Aby dodać do tego, co powiedziano powyżej, często można przeprowadzać testy w sposób niejawny, wiedząc, że zakończą się one niepowodzeniem lub zaliczeniem. Testy te liczą się do spelunkowania danych tak samo jak obliczone.
John
7

Jeśli główne efekty są znaczące, ale nie interakcja, po prostu interpretujesz główne efekty, jak zasugerowałeś.

Nie trzeba uruchamiać innego modelu bez interakcji (generalnie nie jest to najlepsza rada, aby wykluczyć parametry na podstawie istotności, istnieje wiele odpowiedzi na ten temat). Po prostu weź wyniki takimi, jakie są.

Henrik
źródło
1
Czy dałby Pan tę samą radę w drugim akapicie, gdyby PO wskazał, że interakcja nie powinna nastąpić teoretycznie, ale została uwzględniona w modelu jako test dobroci dopasowania?
whuber
Dziękuję bardzo za te szybkie reakcje. Wydaje się jednak, że istnieją pewne różnice w opiniach ... John twierdzi, że muszę uruchomić nowy model bez efektu interakcji, ponieważ „Główny efekt obliczony z obecną interakcją różni się od prawdziwych efektów głównych”.
rozemarijn
Jednak Henrik twierdzi, że nie powinienem uruchamiać nowego modelu. Być może mogę podjąć decyzję, jeśli wiem, dlaczego główny efekt obliczony za pomocą terminu interakcji różni się od prawdziwych głównych efektów ...
rozemarijn
W reakcji na whuber oczekiwano, że interakcja wystąpi teoretycznie i nie została uwzględniona jako test dobroci dopasowania.
rozemarijn
1
Mówiąc trochę: kluczowym rozróżnieniem jest idea efektów od parametrów . Efekty są cechami modelu jako całości, które mogą, ale nie muszą być identyfikowane jako konkretne parametry. Gdy model jest liniowy i nie ma żadnych interakcji, można je w ten sposób zidentyfikować, ale gdy występują interakcje, nie mogą. Moim zdaniem jest to, że jeśli jesteś zmuszony wybierać, tak jak ty, że bardziej zależy ci na efektach niż na parametrach. A jeśli to zrobisz, nie obchodzi Cię już dokładnie, ile z tych drugich potrzebujesz do wygenerowania pierwszego.
conjugateprior