Efekt przyczynowy poprzez regulację drzwi tylnych i drzwi wejściowych

12

Jeśli chcielibyśmy obliczyć przyczynowo-skutkowy wpływ na na poniższym wykresie przyczynowym, możemy użyć zarówno twierdzeń o dopasowaniu tylnych drzwi, jak i przednich drzwi, tj. XY

P(y|do(X=x))=uP(y|x,u)P(u)

i

P(y|do(X=x))=zP(z|x)xP(y|x,z)P(x).

Czy łatwo jest odrobić zadanie domowe, aby wykazać, że dwie korekty prowadzą do tego samego efektu przyczynowego na ?XY

Wykres

Jae
źródło
Czy to prawdziwa praca domowa? Następnie dodaj tag do samodzielnej nauki. Wtedy ludzie mogą dać ci wskazówki, pozostawiając myślenie (i uczenie się) tobie. Powiedz nam, co próbowałeś i gdzie utknąłeś. Pamiętaj, że CV nie służy do odrabiania zadań domowych na zewnątrz ...
Knarpie
5
Cześć Knarpie, to część samokształcenia, a nie zadanie domowe. Obecnie czytam „Wnioskowanie przyczynowe w statystyce” autorstwa Pearl i in. i spędzam około godziny zastanawiając się nad pytaniem, które zadałem powyżej, ponieważ jest to naturalne pytanie, ale nie mogę wykazać równości. Albo czegoś mi brakuje, albo te dwa wyrażenia nie są sobie równe.
Jae,

Odpowiedzi:

13

Akcja odpowiada interwencji na zmiennej która ustawia ją naX xdo(x)Xx . Kiedy interweniujemy na , oznacza to, że rodzice nie wpływają już na jego wartość, co odpowiada usunięciu strzałek wskazujących na Więc reprezentujmy tę interwencję na nowym DAG.X XXXX

wprowadź opis zdjęcia tutaj

Nazwijmy pierwotny rozkład obserwacyjny i rozkład po interwencji . Naszym celem jest, aby wyrazić w kategoriach . Zauważmy, że w mamy, że . Ponadto prawdopodobieństwa przed interwencją i po interwencji mają te dwie niezmienności: i ponieważ nie dotykaliśmy każda strzałka wprowadzająca te zmienne w naszej interwencji. Więc:P P P P U X P ( U ) = P ( U ) P ( Y | X , U ) = P ( Y | X , U )PPPPPUXP(U)=P(U)P(Y|X,U)=P(Y|X,U)

P(Y|do(X)):=P(Y|X)=UP(Y|X,U)P(U|X)=UP(Y|X,U)P(U)=UP(Y|X,U)P(U)

Wyprowadzenie drzwi wejściowych jest nieco bardziej skomplikowane. Po pierwsze zauważ, że nie ma pomieszania między i , stądXZ

P(Z|do(X))=P(Z|X)

Ponadto, używając tej samej logiki do wyprowadzenia , widzimy, że kontrolowanie jest wystarczające do uzyskania efektu na , to znaczyP(Y|do(X))XZY

P(Y|do(Z))=XP(Y|X,Z)P(X)

Gdzie używam liczby pierwszej dla wygody notacji dla następnego wyrażenia. Te dwa wyrażenia są już w kategoriach rozkładu przedinterwencyjnego, a my po prostu wykorzystaliśmy poprzednie uzasadnienie backdoor do ich wyprowadzenia.

Ostatnim elementem należy jedynie wywnioskować efekt w łączący efekt o i w . Aby to zrobić, zauważ na naszym wykresie , ponieważ efekt o jest całkowicie pośredniczy i ścieżka backdoor od do jest zablokowany, gdy interweniowania . W związku z tym:XYZYXZP(Y|Z,do(X))=P(Y|do(Z),do(X))=P(Y|do(Z))XYZZYX

P(Y|do(X))=ZP(Y|Z,do(X))P(Z|do(X))=ZP(Y|do(Z))P(Z|do(X))=ZXP(Y|X,Z)P(X)P(Z|X)=ZP(Z|X)XP(Y|X,Z)P(X)

Gdzie można zrozumieć w następujący sposób: kiedy interweniuję na , wówczas rozkład zmienia się na ; ale tak naprawdę interweniuję w więc chcę wiedzieć, jak często przyjmuje określoną wartość, gdy zmieniam , czyli .ZP(Y|do(Z))P(Z|do(X))ZYP(Y|do(Z))XZXP(Z|do(X))

Dlatego te dwie korekty zapewniają taki sam rozkład po interwencji na tym wykresie, jak pokazaliśmy.


Ponownie czytając twoje pytanie, przyszło mi do głowy, że możesz być zainteresowany bezpośrednim pokazaniem, że prawa strona obu równań jest równa w rozkładzie przedinterwencyjnym (którym muszą być, biorąc pod uwagę nasze poprzednie wyprowadzenie). Nie jest to również trudne do pokazania bezpośrednio. Wystarczy pokazać, że w DAG:

XP(Y|Z,X)P(X)=UP(Y|Z,U)P(U)

Zauważ, że DAG oznacza i a następnie:YX|U,ZUZ|X

XP(Y|Z,X)P(X)=X(UP(Y|Z,X,U)P(U|Z,X))P(X)=X(UP(Y|Z,U)P(U|X))P(X)=UP(Y|Z,U)XP(U|X)P(X)=UP(Y|Z,U)P(U)

W związku z tym:

ZP(Z|X)XP(Y|X,Z)P(X)=ZP(Z|X)UP(Y|Z,U)P(U)=UP(U)ZP(Y|Z,U)P(Z|X)=UP(U)ZP(Y|Z,X,U)P(Z|X,U)=UP(Y|X,U)P(U)
Carlos Cinelli
źródło
2
To bardzo dobra i wyczerpująca odpowiedź. Fragment, w którym rozpoznajesz efekt przyczynowy przez drzwi wejściowe, jest jednak zbędny (OP już to zrobił i wynika wprost z twierdzenia o drzwiach wejściowych), a także zawiera błąd: nie ma „zasady sumy” prawdopodobieństwo ”dla skutków przyczynowych. Oznacza to, że ogólnie nie jest równe , ale raczej , który jest wyraźnie inny. Zobacz wielką książkę Pearl na stronach 87--88.P(Y|do(X))ZP(Y|do(Z))P(Z|do(X)ZP(Y|Z,do(X))P(Z|do(X))
Julian Schuessler,
@JulianSchuessler dlatego właśnie napisałem „można myśleć jako”, jako sposób na zrozumienie, ale nie dosłownie mówiąc, że tak. Jeśli chodzi o pochodzenie drzwi wejściowych, nie było jasne, że OP wiedział, jak je uzyskać, dlatego umieściłem je tam.
Carlos Cinelli,
Świetna odpowiedź. Dzięki, Carlos. Druga część twojej odpowiedzi była dokładnie tym, o co prosiłem. Mam tutaj dwa pytania uzupełniające. 1) Jakiej strategii wyszukiwania używałeś do algebraicznego manipulowania wyrażeniami w drugiej odpowiedzi? (Przez wystarczająco długie zezowanie przy wyrażeniach?) Ponieważ przestrzeń wyszukiwania jest duża, zastanawiam się, jak można napisać algorytm, aby mógł automatycznie dojść do tego samego wniosku.
Jae,
2) Byłem również zdezorientowany, jak interpretować , ponieważ moja pierwsza intuicja była jak sugestia Juliana. Ale Perła et al. w książce, o której wspomniałem, używa się twojego wyrażenia. Zastanawiam się, czy, ogólnie biorąc, biorąc pod uwagę ukierunkowany łańcuch, w którym węzeł początkowy jest przyczyną, a węzeł końcowy skutkiem, każdy czynnik musi być uwarunkowany na a nie na , gdzie jest nutą pośrednią w łańcuchudo ( Z ) Z ZzP(Y|do(Z)P(Z|do(X))do(Z)ZZ
Jae
1
@Jeevaka jest to założenie zakodowane w DAG, implikowane przez faktoryzację i założenie, że system składa się z modułowych, autonomicznych elementów. Zatem zmiany w nie wpływają na . Jednym ze sposobów, aby pomóc w myśleniu o tym, jest zapisanie równań strukturalnych obu modeli (model obserwacyjny) i (model interwencyjny), a następnie wyprowadzenie implikowanych rozkładów i . Zobaczysz, że warunek dla i będzie taki sam w obu. P ( Y | X , U ) M M P P Y X UP(X,U)P(Y|X,U)MMPPYXU
Carlos Cinelli,