Reprezentowanie efektów interakcji na ukierunkowanych wykresach acyklicznych

17

Wyreżyserowane wykresy acykliczne (DAG; np. Greenland i in., 1999) są częścią formalizmu wnioskowania przyczynowego na podstawie kontrfaktycznej interpretacji obozu przyczynowego. Na tych wykresach obecność strzałki ze zmiennej A do zmiennej B potwierdza, że ​​zmienna A bezpośrednio powoduje (pewną zmianę ryzyka) zmienną B , a brak takiej strzałki potwierdza, że ​​zmienna A nie powoduje bezpośrednio (pewnej zmiany ryzyka of) zmienna B .

Na przykład stwierdzenie „narażenie na dym tytoniowy bezpośrednio powoduje zmianę ryzyka międzybłoniaka” jest reprezentowane przez czarną strzałkę od „narażenia na dym tytoniowy” na „międzybłoniak” na poniższym schemacie przyczynowym innym niż DAG .

Podobnie stwierdzenie „narażenie na azbest bezpośrednio powoduje zmianę ryzyka międzybłoniaka” jest reprezentowane przez czarną strzałkę od „narażenia na azbest” na „międzybłoniak” na poniższym wykresie przyczynowym innym niż DAG .

Używam tego terminu nie DAG aby opisać poniższy wykres przyczynowy z powodu czerwonej strzałki, którą zamierzam twierdzić, że „ekspozycja na azbest powoduje zmianę bezpośredniego wpływu przyczynowego ekspozycji na dym tytoniowy na ryzyko międzybłoniaka” (azbest działa fizycznie uszkodzenie komórek płuc, które nie tylko bezpośrednio powoduje zmianę ryzyka międzybłoniaka, ale także czyni komórki bardziej podatnymi na rakotwórcze szkody wynikające z narażenia na dym tytoniowy, w wyniku czego narażenie zarówno na azbest, jak i tytoń powoduje wzrost ryzyko, które jest większe niż suma dwóch oddzielnych ryzyk), a to nie do końca pasuje do formalnego znaczenia strzałek przyczynowych w DAG, które opisałem na początku mojego pytania (tj. ponieważ czerwona strzałka nie kończy się zmienną ).

Nie jest to ukierunkowany wykres acykliczny: ekspozycja na dym tytoniowy powoduje zwiększone ryzyko międzybłoniaka;  ekspozycja na azbest powoduje zwiększone ryzyko międzybłoniaka;  ekspozycja na azbest powoduje wzrost przyczynowego wpływu tytoniu na ryzyko międzybłoniaka.

Jak poprawnie przedstawić efekty interakcji w formalizmie wizualnym DAG?

Bibliografia

Greenland, S., Pearl, J. i Robins, JM (1999). Diagramy przyczynowe dla badań epidemiologicznych . Epidemiology , 10 (1): 37–48.

Alexis
źródło
Czy można zmienić DAG, dodając węzeł do uszkodzenia komórek płuc ze strzałkami z tytoniu i azbestu skierowanymi do środka oraz strzałką do wyleczenia międzybłoniaka? To utrzymuje DAG i zapewnia elastyczność w modelowaniu efektów indywidualnych i złożonych.
John Woolf,
Tak, myślałem o czymś takim, ale zastanawiam się, czy to również sugeruje, że głównym efektem tytoniu nie jest również „uszkodzenie komórek płucnych”, gdy jest. Podejrzewam, że można dodać kolejną zmienną „tytoń i azbest razem”, spowodowaną przez tytoń i azbest, ale wydaje się to niezgrabne ... ale być może właśnie z tym trzeba iść.
Alexis,
Jakiego oprogramowania użyłeś do utworzenia wykresu?
zipzapboing
@zipzapboing narysował go ręcznie w MS Word, PageStream, Scribus lub czymś innym, a następnie edytował pod kątem kolorów i przezroczystości za pomocą GIMP. (W rzeczywistości jest to fragment niektórych moich slajdów z wykładów).
Alexis

Odpowiedzi:

9

Teoria przyczynowości Pearl jest całkowicie nieparametryczna . Z tego powodu interakcje nie są wyraźne, ani na wykresie, ani w reprezentowanych równaniach strukturalnych. Zakłada się jednak, że skutki przyczynowe mogą się (dziko) zmieniać.

Jeśli efekt zostanie zidentyfikowany i oszacujesz go na podstawie danych nieparametrycznych, uzyskasz pełny rozkład efektów przyczynowych (zamiast, powiedzmy, jednego parametru). W związku z tym można ocenić nieparametrycznie wpływ przyczynowy narażenia na tytoń pod warunkiem narażenia na działanie azbestu, aby sprawdzić, czy się zmienia, bez konieczności przyjmowania jakiejkolwiek formy funkcjonalnej.

Rzućmy okiem na równania strukturalne w twoim przypadku, które odpowiadają twojemu „DAG” pozbawionemu czerwonej strzałki:

f1ϵm )

f2ϵt

f3ϵa

gdzie ϵ

Pozostawiliśmy odpowiednie funkcje f () i rozkłady błędów nieokreślone, z wyjątkiem tego, że te ostatnie są niezależne. Niemniej jednak możemy zastosować teorię Pearl i od razu stwierdzić, że zidentyfikowano przyczynowe skutki narażenia zarówno na tytoń, jak i azbest na międzybłoniaka . Oznacza to, że gdybyśmy mieli nieskończenie wiele obserwacji z tego procesu, moglibyśmy dokładnie zmierzyć efekt ustawienia ekspozycji na różnych poziomach, po prostu widząc przypadki międzybłoniaka u osób o różnych poziomach ekspozycji. Możemy więc wnioskować o przyczynowości bez przeprowadzania rzeczywistego eksperymentu. Wynika to z faktu, że nie ma ścieżek tylnych drzwi od zmiennych ekspozycji do zmiennej wynikowej.

Więc byś dostał

P (międzybłoniak | do (Tytoń = t)) = P (międzybłoniak | Tytoń = t)

Ta sama logika odnosi się do przyczynowego efektu azbestu, który pozwala po prostu ocenić:

P (międzybłoniak | Tytoń = t, azbest = a) - P (międzybłoniak | Tytoń = t ', azbest = a)

W porównaniu do

P (międzybłoniak | Tytoń = t, azbest = a ') - P (międzybłoniak | Tytoń = t', azbest = a ')

dla wszystkich odpowiednich wartości t oraz a w celu oszacowania efektów interakcji.

W konkretnym przykładzie załóżmy, że zmienna wynikowa jest zmienną Bernoulliego - możesz mieć międzybłoniaka lub nie - i że dana osoba była narażona na bardzo wysoki poziom azbestu a. Wtedy jest bardzo prawdopodobne, że będzie cierpiał na międzybłoniaka; w związku z tym efekt zwiększenia ekspozycji na tytoń będzie bardzo niski. Z drugiej strony, jeśli poziomy azbestu a 'są bardzo niskie, zwiększenie ekspozycji na tytoń będzie miało większy wpływ. Stanowiłoby to interakcję między skutkami tytoniu i azbestu.

Oczywiście estymacja nieparametryczna może być bardzo wymagająca i hałaśliwa ze skończonymi danymi i mnóstwem różnych wartości ti wartości, więc możesz pomyśleć o założeniu jakiejś struktury w f (). Ale w zasadzie możesz to zrobić bez tego.

Julian Schuessler
źródło
Julian, dziękuję za dogłębną logikę przyczynową Pearl. Twoja odpowiedź zostałaby poprawiona poprzez przemówienie do wizualnej reprezentacji efektów interakcji, która była kluczowa dla mojego pytania (być może przez powiedzenie „DAGs nie wyrażają wyraźnie efektów interakcji” lub co masz).
Alexis
1
Tak masz rację; Na początku starałem się to wyjaśnić.
Julian Schuessler
Julian, to świetnie. Mówisz, że elementami składowymi DAG nie są poszczególne łącza, C = f (D), ale bardziej ogólnie zestawy łączy, C = f (D, E, ...). Moim problemem jest to, że Pearl jest czasem niejasna, np. W „Przyczynowości” jego Def 2.2.1 .: „Struktura przyczynowa zbioru zmiennych V jest DAG, w którym każdy węzeł odpowiada odrębnemu elementowi V, a każdy link reprezentuje bezpośredni związek funkcjonalny między odpowiadającymi zmiennymi. ” Z pewnością pojedyncze linki rodziców C do C same w sobie nic nie znaczą, pokazują jedynie udział we wspólnym wpływie na C. Zgadzasz się?
Steve Powell,
Tak. C = f (D, E) byłyby pokazane za pomocą dwóch linków na wykresie od D / E do C. Interpretacja linków jest taka, że ​​D i E określają C. Więc linki są oczywiście relacyjne.
Julian Schuessler,
10

Prosta odpowiedź brzmi: już to robisz. Konwencjonalne DAG przedstawiają nie tylko główne efekty, ale raczej połączenie głównych efektów i interakcji. Po narysowaniu DAG już zakładasz, że dowolne zmienne wskazujące na ten sam wynik mogą modyfikować działanie innych wskazujących na ten sam wynik. Jest to założenie modelowania, odrębne od DAG, które zakłada brak interakcji.

Ponadto interakcja może wystąpić bez uwzględnienia w modelu wyraźnego terminu interakcji. Jeśli uwzględnisz główne efekty tylko w modelu dla współczynnika ryzyka Y w odniesieniu do leczenia T i zmiennej Q, oszacowanie różnicy ryzyka będzie się różnić w zależności od poziomu Q. Aby nieparametrycznie uwzględnić wszystkie te możliwości, DAG tylko najsłabsze założenia dotyczące funkcjonalnej formy relacji między zmiennymi, a zakładanie braku interakcji jest silniejszym założeniem pozwalającym na interakcję. To znowu oznacza, że ​​DAG już pozwalają na interakcję bez żadnych korekt. Zobacz Vanderweele (2009), aby uzyskać omówienie interakcji, która wykorzystuje konwencjonalne DAG, ale pozwala na interakcję.

Bollen i Paxton (1998) oraz Muthén i Asparouhov (2015) zarówno wykazują interakcje w modelach ścieżek ze zmiennymi ukrytymi, ale te interakcje wyraźnie odnoszą się do terminów produktowych w modelu parametrycznym, a nie do interakcji szeroko. Widziałem również diagramy podobne do twoich, gdzie strzałka przyczynowa wskazuje na ścieżkę, ale ściśle mówiąc, ścieżka nie jest unikalną wielkością, na którą zmienna może mieć wpływ przyczynowy (nawet jeśli tak właśnie chcemy interpretować nasze modele) ; po prostu reprezentuje obecność efektu przyczynowego, a nie jego wielkość.


Bollen, KA i Paxton, P. (1998). Oddziaływania zmiennych utajonych w modelach równań strukturalnych. Modelowanie równań strukturalnych: A Multidisciplinary Journal, 5 (3), 267-293.

Muthén, B., i Asparouhov, T. (2015). Utajone interakcje zmiennych.

VanderWeele, TJ (2009). Na rozróżnienie między interakcją a modyfikacją efektu. Epidemiology, 20 (6), 863-871.

Noah
źródło
3
Ponadto: „Po narysowaniu DAG już zakładasz, że dowolne zmienne wskazujące na ten sam wynik mogą modyfikować działanie innych wskazujących na ten sam wynik. Jest to założenie modelowania, odrębne od DAG, które zakłada brak interakcja ”. jest genialny ... naprawdę pomógł tym pomysłom wylądować ze mną.
Alexis,