Czy niezależność statystyczna oznacza brak związku przyczynowego?

40

Dwie losowe zmienne A i B są statystycznie niezależne. Oznacza to, że w DAG procesu: i oczywiście P ( A | B ) = P ( A ) . Ale czy to oznacza również, że nie ma drzwi od B do A?(AB)P(A|B)=P(A)

Ponieważ wtedy powinniśmy uzyskać . Jeśli tak, to czy niezależność statystyczna automatycznie oznacza brak związku przyczynowego?P(A|do(B))=P(A)

użytkownik1834069
źródło

Odpowiedzi:

37

Jeśli tak, to czy niezależność statystyczna automatycznie oznacza brak związku przyczynowego?

Nie, a oto prosty licznik z wielowymiarową normą,

set.seed(100)
n <- 1e6
a <- 0.2
b <- 0.1
c <- 0.5
z <- rnorm(n)
x <- a*z + sqrt(1-a^2)*rnorm(n)
y <- b*x - c*z + sqrt(1- b^2 - c^2 +2*a*b*c)*rnorm(n)
cor(x, y)

Z odpowiednim wykresem

wprowadź opis zdjęcia tutaj

Tutaj mamy to i Y są niezależne marginalnie (w normalnym przypadku wielowymiarowej, zerowa korelacja oznacza niezależność). Dzieje się tak, ponieważ ścieżka backdoora przez z dokładnie anuluje bezpośrednią ścieżkę od x do y , to znaczy c o v ( x , y ) = b - a c = 0,1 - 0,1 = 0 . Zatem E [ Y | X = x ] = E [ Y ]xyzxycov(x,y)=bac=0.10.1=0 . Jednak x bezpośrednio powoduje y , a my mamy to E [ Y | d o ( X = x ) ] = b x , który różni się od E [ Y ] = 0 .E[Y|X=x]=E[Y]=0xyE[Y|do(X=x)]=bxE[Y]=0

Stowarzyszenia, interwencje i scenariusze alternatywne

Myślę, że ważne jest, aby tu wyjaśnić niektóre skojarzenia, interwencje i scenariusze alternatywne.

Modele przyczynowe zawierają stwierdzenia dotyczące zachowania systemu: (i) pod obserwacjami pasywnymi, (ii) pod interwencjami, a także (iii) scenariusz alternatywny. Niezależność na jednym poziomie niekoniecznie przekłada się na drugi.

Jak pokazuje powyższy przykład, nie możemy mieć żadnego związku między i Y , to znaczy P ( YXY , i nadal tak jest, że manipulacje na X zmieniają rozkład Y , to znaczy P ( Y | d o ( x ) ) P ( Y ) .P(Y|X)=P(Y)XYP(Y|do(x))P(Y)

XYP(Y|do(x))=P(Y)YX

Te trzy poziomy tworzą hierarchię zadań wnioskowania przyczynowego pod względem informacji potrzebnych do udzielenia odpowiedzi na pytania dotyczące każdego z nich.

Carlos Cinelli
źródło
1
Dziękuję, właśnie tego szukałem. Sądzę więc, że moje zamieszanie było spowodowane (bez zamierzonej gry słów) myśleniem, że statystyczna niezależność oznacza również separację D między dwiema zmiennymi. Ale to działa tylko na odwrót, prawda?
user1834069,
@ user1834069 to prawda, separacja d oznacza niezależność, ale niezależność nie oznacza separacji d. Te dwa są przykładami, w których rozkład jest niewierny na wykresie, i widać, że zależy od wyboru parametryzacji. Jeśli zmienimy parametry, zależność pojawi się ponownie.
Carlos Cinelli
Niezły przykład. Jeśli dobrze pamiętam, jest to jedno z nie dających się przetestować założeń eksploracji danych przyczynowych na podstawie danych obserwacyjnych. W przypadku modeli liniowych w SEM książka Pearl wspomina również, że zbiór współczynników, które powodują niewierny rozkład, ma miarę 0.
Vimal
37

Załóżmy, że mamy żarówkę kontrolowaną przez dwa przełączniki. Niech S1S2LL=XOR(S1,S2)

LS1S2

p(S1=1)=p(S2=1)=0.5S1S2P(L=1)=0.5p(LS1)=p(LS2)=p(L)LS1LS2

LS1S2

user20160
źródło
2
P(L|do(S1))=P(L)
p(L|S1,S2)p(L)(vL,v1,v2){0,1}3p(L=vL|S1=v1)=p(L=vL|S2=v2)=0.5 p(L=vL|S1=v1,S2=v2){0,1}
0

W oparciu o twoje pytanie możesz myśleć w ten sposób:

P(AB)=P(A)P(B)AB

P(AB)/P(A)=P(B|A)=P(B)

P(AB)/P(B)=P(A|B)=P(A)

Pod tym względem uważam, że niezależność oznacza brak związku przyczynowego. Jednak zależność niekoniecznie oznacza związek przyczynowy.

Szejk
źródło
2
P(AB)=P(A)P(B)P(A|do(B))=P(A)