Wyreżyserowane wykresy acykliczne (DAG; np. Greenland i in., 1999) są częścią formalizmu wnioskowania przyczynowego na podstawie kontrfaktycznej interpretacji obozu przyczynowego. Na tych wykresach obecność strzałki ze zmiennej do zmiennej potwierdza, że zmienna bezpośrednio powoduje (pewną zmianę ryzyka) zmienną , a brak takiej strzałki potwierdza, że zmienna nie powoduje bezpośrednio (pewnej zmiany ryzyka of) zmienna .
Na przykład stwierdzenie „narażenie na dym tytoniowy bezpośrednio powoduje zmianę ryzyka międzybłoniaka” jest reprezentowane przez czarną strzałkę od „narażenia na dym tytoniowy” na „międzybłoniak” na poniższym schemacie przyczynowym innym niż DAG .
Podobnie stwierdzenie „narażenie na azbest bezpośrednio powoduje zmianę ryzyka międzybłoniaka” jest reprezentowane przez czarną strzałkę od „narażenia na azbest” na „międzybłoniak” na poniższym wykresie przyczynowym innym niż DAG .
Używam tego terminu nie DAG aby opisać poniższy wykres przyczynowy z powodu czerwonej strzałki, którą zamierzam twierdzić, że „ekspozycja na azbest powoduje zmianę bezpośredniego wpływu przyczynowego ekspozycji na dym tytoniowy na ryzyko międzybłoniaka” (azbest działa fizycznie uszkodzenie komórek płuc, które nie tylko bezpośrednio powoduje zmianę ryzyka międzybłoniaka, ale także czyni komórki bardziej podatnymi na rakotwórcze szkody wynikające z narażenia na dym tytoniowy, w wyniku czego narażenie zarówno na azbest, jak i tytoń powoduje wzrost ryzyko, które jest większe niż suma dwóch oddzielnych ryzyk), a to nie do końca pasuje do formalnego znaczenia strzałek przyczynowych w DAG, które opisałem na początku mojego pytania (tj. ponieważ czerwona strzałka nie kończy się zmienną ).
Jak poprawnie przedstawić efekty interakcji w formalizmie wizualnym DAG?
Bibliografia
Greenland, S., Pearl, J. i Robins, JM (1999). Diagramy przyczynowe dla badań epidemiologicznych . Epidemiology , 10 (1): 37–48.
źródło
Odpowiedzi:
Teoria przyczynowości Pearl jest całkowicie nieparametryczna . Z tego powodu interakcje nie są wyraźne, ani na wykresie, ani w reprezentowanych równaniach strukturalnych. Zakłada się jednak, że skutki przyczynowe mogą się (dziko) zmieniać.
Jeśli efekt zostanie zidentyfikowany i oszacujesz go na podstawie danych nieparametrycznych, uzyskasz pełny rozkład efektów przyczynowych (zamiast, powiedzmy, jednego parametru). W związku z tym można ocenić nieparametrycznie wpływ przyczynowy narażenia na tytoń pod warunkiem narażenia na działanie azbestu, aby sprawdzić, czy się zmienia, bez konieczności przyjmowania jakiejkolwiek formy funkcjonalnej.
Rzućmy okiem na równania strukturalne w twoim przypadku, które odpowiadają twojemu „DAG” pozbawionemu czerwonej strzałki:
gdzieϵ
Pozostawiliśmy odpowiednie funkcje f () i rozkłady błędów nieokreślone, z wyjątkiem tego, że te ostatnie są niezależne. Niemniej jednak możemy zastosować teorię Pearl i od razu stwierdzić, że zidentyfikowano przyczynowe skutki narażenia zarówno na tytoń, jak i azbest na międzybłoniaka . Oznacza to, że gdybyśmy mieli nieskończenie wiele obserwacji z tego procesu, moglibyśmy dokładnie zmierzyć efekt ustawienia ekspozycji na różnych poziomach, po prostu widząc przypadki międzybłoniaka u osób o różnych poziomach ekspozycji. Możemy więc wnioskować o przyczynowości bez przeprowadzania rzeczywistego eksperymentu. Wynika to z faktu, że nie ma ścieżek tylnych drzwi od zmiennych ekspozycji do zmiennej wynikowej.
Więc byś dostał
P (międzybłoniak | do (Tytoń = t)) = P (międzybłoniak | Tytoń = t)
Ta sama logika odnosi się do przyczynowego efektu azbestu, który pozwala po prostu ocenić:
P (międzybłoniak | Tytoń = t, azbest = a) - P (międzybłoniak | Tytoń = t ', azbest = a)
W porównaniu do
P (międzybłoniak | Tytoń = t, azbest = a ') - P (międzybłoniak | Tytoń = t', azbest = a ')
dla wszystkich odpowiednich wartości t oraz a w celu oszacowania efektów interakcji.
W konkretnym przykładzie załóżmy, że zmienna wynikowa jest zmienną Bernoulliego - możesz mieć międzybłoniaka lub nie - i że dana osoba była narażona na bardzo wysoki poziom azbestu a. Wtedy jest bardzo prawdopodobne, że będzie cierpiał na międzybłoniaka; w związku z tym efekt zwiększenia ekspozycji na tytoń będzie bardzo niski. Z drugiej strony, jeśli poziomy azbestu a 'są bardzo niskie, zwiększenie ekspozycji na tytoń będzie miało większy wpływ. Stanowiłoby to interakcję między skutkami tytoniu i azbestu.
Oczywiście estymacja nieparametryczna może być bardzo wymagająca i hałaśliwa ze skończonymi danymi i mnóstwem różnych wartości ti wartości, więc możesz pomyśleć o założeniu jakiejś struktury w f (). Ale w zasadzie możesz to zrobić bez tego.
źródło
Prosta odpowiedź brzmi: już to robisz. Konwencjonalne DAG przedstawiają nie tylko główne efekty, ale raczej połączenie głównych efektów i interakcji. Po narysowaniu DAG już zakładasz, że dowolne zmienne wskazujące na ten sam wynik mogą modyfikować działanie innych wskazujących na ten sam wynik. Jest to założenie modelowania, odrębne od DAG, które zakłada brak interakcji.
Ponadto interakcja może wystąpić bez uwzględnienia w modelu wyraźnego terminu interakcji. Jeśli uwzględnisz główne efekty tylko w modelu dla współczynnika ryzyka Y w odniesieniu do leczenia T i zmiennej Q, oszacowanie różnicy ryzyka będzie się różnić w zależności od poziomu Q. Aby nieparametrycznie uwzględnić wszystkie te możliwości, DAG tylko najsłabsze założenia dotyczące funkcjonalnej formy relacji między zmiennymi, a zakładanie braku interakcji jest silniejszym założeniem pozwalającym na interakcję. To znowu oznacza, że DAG już pozwalają na interakcję bez żadnych korekt. Zobacz Vanderweele (2009), aby uzyskać omówienie interakcji, która wykorzystuje konwencjonalne DAG, ale pozwala na interakcję.
Bollen i Paxton (1998) oraz Muthén i Asparouhov (2015) zarówno wykazują interakcje w modelach ścieżek ze zmiennymi ukrytymi, ale te interakcje wyraźnie odnoszą się do terminów produktowych w modelu parametrycznym, a nie do interakcji szeroko. Widziałem również diagramy podobne do twoich, gdzie strzałka przyczynowa wskazuje na ścieżkę, ale ściśle mówiąc, ścieżka nie jest unikalną wielkością, na którą zmienna może mieć wpływ przyczynowy (nawet jeśli tak właśnie chcemy interpretować nasze modele) ; po prostu reprezentuje obecność efektu przyczynowego, a nie jego wielkość.
Bollen, KA i Paxton, P. (1998). Oddziaływania zmiennych utajonych w modelach równań strukturalnych. Modelowanie równań strukturalnych: A Multidisciplinary Journal, 5 (3), 267-293.
Muthén, B., i Asparouhov, T. (2015). Utajone interakcje zmiennych.
VanderWeele, TJ (2009). Na rozróżnienie między interakcją a modyfikacją efektu. Epidemiology, 20 (6), 863-871.
źródło