znaczenie (x) operatora?

14

Wszędzie widziałem operatora w jakimś przeglądzie literatury na temat przyczynowości (patrz, na przykład, ten wpis na Wikipedii ). Nie mogę jednak znaleźć formalnej i ogólnej definicji tego operatora.do(x)

Czy ktoś może wskazać mi dobre odniesienie w tej sprawie? Interesuje mnie ogólna definicja, a nie jej interpretacja w konkretnym eksperymencie.

Judio
źródło
1
Związane ze stats.stackexchange.com/questions/69806/…
Carlos Cinelli

Odpowiedzi:

11

To znaczy rachunek. Wyjaśniają to tutaj :do

Interwencje i kontrfaktyczne są definiowane za pomocą operatora matematycznego o nazwie , który symuluje interwencje fizyczne, usuwając niektóre funkcje z modelu, zastępując je stałą , zachowując pozostałą część modelu bez zmian. Powstały model jest oznaczony .X = x M xdo(x)X=xMx

Mbiron
źródło
13

Probabilistyczny strukturalny model przyczynowy (SCM) jest zdefiniowany jako krotka gdzie jest zbiorem zmiennych egzogenicznych, zbiorem zmiennych endogenicznych, jest zbiorem wzory strukturalne, które określa wartości każdej zmiennej endogennych i o rozkład prawdopodobieństwa, na domenie .U V K P ( U ) UM=U,V,F,P(U)UVFP(U)U

W SCM reprezentujemy wpływ interwencji na zmienną podmodelem gdzie wskazuje, że równanie strukturalne dla jest zastąpione nowym równaniem interwencyjnym. Na przykład interwencja atomowa polegająca na ustawieniu zmiennej na określoną wartość --- zwykle oznaczoną przez --- polega na zastąpieniu równania dla równaniem .M x = U , V , M x , P ( U ) M x X X x d o ( X = x ) x X = xXMx=U,V,Fx,P(U)FxXXxdo(X=x)XX=x

Aby wyjaśnić pomysły, wyobraź sobie nieparametryczny strukturalny model przyczynowy zdefiniowany przez następujące równania strukturalne:M

Z=UzX=f(Z,Ux)Y=g(X,Z,Uy)

Gdzie zaburzenia mają pewien rozkład prawdopodobieństwa . To indukuje rozkład prawdopodobieństwa dla zmiennych endogennych , a w szczególności rozkład warunkowy dla , .P ( U ) P M ( Y , Z , X ) Y X P M ( Y | X )UP(U)PM(Y,Z,X)YXPM(Y|X)

Ale zawiadomienie jest „obserwacyjne” dystrybucja danego w kontekście modelu . Jaki byłby wpływ na rozkład , gdybyśmy interweniowali w ustawieniu na ? Jest to nic innego jak rozkład prawdopodobieństwa indukowany przez zmodyfikowany model :Y X M Y X x Y M xPM(Y|X)YXMYXxYMx

Z=UzX=xY=g(X,Z,Uy)

Oznacza to, że prawdopodobieństwo interwencyjne jeśli ustawimy jest określone przez prawdopodobieństwo indukowane w , to znaczy i jest zwykle oznaczone przez . Operator wyjaśnia, że ​​obliczamy prawdopodobieństwo w podmodelu, w którym występuje ustawienie interwencji równe , co odpowiada zastąpieniu równania strukturalnego równaniem .X = x M x P M x ( Y | X = x ) P ( Y | d o ( X = x ) ) d o ( X = x ) Y X x X X = xYX=xMxPMx(Y|X=x)P(Y|do(X=x))do(X=x)YXxXX=x

Celem wielu analiz jest znalezienie sposobu wyrażenia rozkładu interwencyjnego w kategoriach łącznego prawdopodobieństwa rozkładu obserwacyjnego (przed interwencją).P(Y|do(X))

rachunek różniczkowy

Zrób rachunek nie jest to samo, jak operator. Zrób rachunek składa się z trzech reguł wnioskowania do pomocy „masażu” rozkładu prawdopodobieństwa po interwencji i dostać pod względem obserwacyjnym (pre-interwencyjnym) dystrybucji. Dlatego zamiast robić pochodne ręcznie, na przykład w tym pytaniu, możesz pozwolić algorytmowi wykonać pochodne i automatycznie dać ci nieparametryczne wyrażenie do identyfikacji twojego interesującego zapytania przyczynowego ( a rachunek do jest kompletny dla rekurencyjnego nieparametrycznego związku przyczynowego modele ).P ( Y | d o ( X ) )do()P(Y|do(X))

Carlos Cinelli
źródło
Myślę, że możesz być jednym z nielicznych, którzy są zatwierdzeni przez krzyż, którzy mogą być zainteresowani i mogą odpowiedzieć na to pytanie: stats.stackexchange.com/q/444249/62396
joshphysics