Jak sprawdzić, czy współczynnik regresji jest moderowany przez zmienną grupującą?

9

Mam regresję przeprowadzoną na dwóch grupach próby na podstawie zmiennej moderującej (powiedzmy płeć). Wykonuję prosty test efektu moderacji, sprawdzając, czy znaczenie regresji jest utracone w jednym zestawie, a pozostaje w drugim.

P1: Powyższa metoda jest poprawna, prawda?

Q2: Poziom ufności moich badań wynosi 95%. Dla jednej grupy regresja jest znacząca przy 0,000. Z drugiej strony jest znaczący przy 0,038. Uważam, że muszę zaakceptować obie regresje jako znaczące i że nie ma efektu moderującego. Akceptacja regresji jest znacząca w chwili, gdy okazuje się, że nie jest to 0.01. Powoduję błąd typu I (akceptując argument fałsz)?

Skorpion
źródło

Odpowiedzi:

12

Wydaje się, że twoja metoda nie rozwiązuje problemu, zakładając, że „efekt moderujący” to zmiana jednego lub więcej współczynników regresji między dwiema grupami. Testy istotności w regresji oceniają, czy współczynniki są niezerowe. Porównanie wartości p w dwóch regresjach niewiele mówi (jeśli w ogóle) o różnicach w tych współczynnikach między dwiema próbkami.

Zamiast tego wprowadź płeć jako zmienną fikcyjną i oddziałuj na nią ze wszystkimi interesującymi współczynnikami. Następnie sprawdź istotność powiązanych współczynników.

Na przykład w najprostszym przypadku (jednej zmiennej niezależnej) dane mogą być wyrażone jako lista krotek gdzie są płciami, zakodowane jako i . Model dla płci to(xi,yi,gi)gi010

yi=α0+β0xi+εi

(gdzie indeksuje dane, dla których ), a model dla płci toigi=01

yi=α1+β1xi+εi

(gdzie indeksuje dane, dla których ). Parametry to , , i . Błędy to . Załóżmy, że są niezależne i identycznie rozmieszczone przy zerowych środkach. Model łączony w celu przetestowania różnicy nachyleń ( ) można zapisać jakoigi=1α0α1β0β1εiβ

yi=α+β0xi+(β1β0)(xigi)+εi

(gdzie rozciąga się na wszystkie dane), ponieważ gdy ustawisz ostatni termin wypada, dając pierwszy model z , a gdy ustawisz dwie wielokrotności łączą się, dając , co daje drugi model z . Dlatego możesz sprawdzić, czy nachylenia są takie same („efekt moderacji”), dopasowując modeligi=0α=α0gi=1xiβ1α=α1

yi=α+βxi+γ(xigi)+εi

i sprawdzenie, czy szacowany rozmiar efektu moderującego, , wynosi zero. Jeśli nie masz pewności, czy przechwytywanie będzie takie samo, dołącz czwarty termin:γ^

yi=α+δgi+βxi+γ(xigi)+εi.

Nie musisz sprawdzać, czy ma wartość zero, jeśli nie jest to interesujące: jest uwzględniony, aby umożliwić osobne dopasowania liniowe do dwóch płci bez wymuszania takiego samego przechwytywania.δ^

Głównym ograniczeniem tego podejścia jest założenie, że wariancje błędów są takie same dla obu płci. Jeśli nie, musisz uwzględnić tę możliwość, a to wymaga nieco więcej pracy z oprogramowaniem w celu dopasowania do modelu i głębszego zastanowienia się, jak przetestować istotność współczynników.εi

Whuber
źródło
Dzięki, rozumiem, jak to działa. Czy ta metoda działa, jeśli mam wiele zmiennych moderujących? Powiedzmy na przykład region (wiejski / miejski), poziom wykształcenia (liceum wykształcone / nie)? Czy mogę dodać dodatkowe zmienne fikcyjne i przetestować efekt?
skorpion
1
@ whuber, czasami spotykam funkcjonalnie podobne sytuacje, w których analityk po prostu dzieli próbkę na dwie grupy, używa tego samego zestawu zmiennych niezależnych dla obu grup i po prostu porównuje jakościowo współczynniki. Czy są jakieś zalety tej sytuacji, którą właśnie opisałem, w porównaniu z tym sformułowaniem stosowania efektów interakcji?
Andy W
3
@ Andy Bez zamiaru zabrania głosu krytycznego lub deprecjonującego, jedyną zaletą, jaką mogę wymyślić w przypadku metody jakościowej, jest to, że nie stwarza żadnych wymagań co do zrozumienia i kompetencji analityka: dzięki temu jest dostępna dla większej liczby osób. Podejście jakościowe jest obarczone trudnościami. Na przykład mogą występować duże pozorne różnice między zarówno zboczami, jak i przecięciami przez przypadek. Jakościowa ocena tylko współczynników nie będzie w stanie odróżnić tej sytuacji od rzeczywistych efektów.
whuber
1
@ Whuber, moja początkowa myśl była taka sama, a ostatnio podałem tę samą sugestię koledze, który zignorował ją ze względu na prostotę (jak wspomniałeś). Pomyślałem, że być może komentarz dotyczący założenia, że ​​wariancje błędów są takie same dla obu płci, może sprawić, że podejście dwóch modeli będzie bardziej odpowiednie, biorąc pod uwagę, że założenie zostało naruszone.
Andy W
1
@Andy Tak, ale możliwość różnych odchyleń nie zwiększa wartości porównania nie-jakościowego. Wymagałoby to raczej bardziej szczegółowego porównania ilościowego oszacowań parametrów. Na przykład, jako przybliżone (ale informacyjne) przybliżenie, można wykonać wariant testu t CABF lub Satterthwaite w oparciu o oszacowane wariancje błędów i ich stopnie swobody. Nawet wizualne zbadanie dobrze skonstruowanego wykresu rozrzutu byłoby łatwe do wykonania i znacznie bardziej pouczające niż zwykłe porównanie współczynników regresji.
whuber
-1

Wydaje mi się, że moderowanie zmiennej grupującej działałoby równie dobrze podczas porównywania współczynników regresji w niezależnych falach danych przekrojowych (np. Rok 1, rok 2 i rok 3 jako grupa 1 grupa 2 i grupa 3)?

kasztanowiec
źródło