Jaka jest matematyczna definicja związku przyczynowego między dwiema zmiennymi losowymi?
Biorąc pod uwagę próbkę ze wspólnego rozkładu dwóch zmiennych losowych i , kiedy powiedzielibyśmy, że powoduje ?
Dla kontekstu czytam ten artykuł o odkryciu przyczynowym .
Odpowiedzi:
Matematycznie model przyczynowy składa się z zależności funkcjonalnych między zmiennymi. Rozważmy na przykład układ równań strukturalnych poniżej:
Oznacza to, żex funkcjonalnie określa wartość y (jeśli interweniujesz na x zmienia to wartości y ), ale nie na odwrót. Graficznie jest to zwykle reprezentowane przez x→y , co oznacza, że x wchodzi do równania strukturalnego y. Jako uzupełnienie można również wyrazić model przyczynowy w kategoriach wspólnych rozkładów zmiennych alternatywnych, który jest matematycznie równoważny modelom funkcjonalnym .
Czasami (lub przez większość czasu) nie masz wiedzy o kształcie równań strukturalnychfx , fy , ani nawet czy x→y czy y→x . Jedyną dostępną informacją jest łączny rozkład prawdopodobieństwa p(y,x) (lub próbki z tego rozkładu).
To prowadzi do twojego pytania: kiedy mogę odzyskać kierunek przyczynowości tylko na podstawie danych? A dokładniej, kiedy mogę odzyskać, czyx wchodzi do równania strukturalnego y lub odwrotnie, tylko z danych?
Oczywiście bez jakichkolwiek zasadniczo niemożliwych do sprawdzenia założeń dotyczących modelu przyczynowego jest to niemożliwe . Problem polega na tym, że kilka różnych modeli przyczynowych może pociągać za sobą taki sam wspólny rozkład prawdopodobieństwa obserwowanych zmiennych. Najczęstszym przykładem jest przyczynowy układ liniowy z szumem gaussowskim.
Ale przy pewnych założeniach przyczynowych może to być możliwe - i nad tym działa literatura dotycząca odkrywania przyczyn. Jeśli nie miałeś wcześniejszego kontaktu z tym tematem, możesz zacząć od Elementów wnioskowania przyczynowego Petersa, Janzinga i Scholkopfa, a także rozdziału 2 z Causality autorstwa Judei Pearl. Mamy tutaj temat na CV z referencjami na temat odkryć przyczynowych , ale nie mamy tam jeszcze tak wielu referencji.
Dlatego nie ma tylko jednej odpowiedzi na twoje pytanie, ponieważ zależy to od przyjętych założeń. Wspomniany artykuł przytacza kilka przykładów, takich jak założenie modelu liniowego z szumem niegaussowskim . Ten przypadek jest znany jako LINGAN (skrót od liniowego niegaussowskiego modelu acyklicznego), oto przykład w
R
:Zauważ, że mamy liniowy model przyczynowy z hałasem niegaussowskim, w którymx2 powoduje x1 a lingam poprawnie odzyskuje kierunek przyczynowo-skutkowy. Zauważ jednak, że zależy to krytycznie od założeń LINGAM.
W przypadku cytowanego artykułu przyjmują to konkretne założenie (patrz ich „postulat”):
Jeślix→y , minimalna długość opisu mechanizmu odwzorowującego X na Y jest niezależna od wartości X, podczas gdy minimalna długość opisu mechanizmu odwzorowującego Y na X zależy od wartości Y.
Zauważ, że to założenie. To właśnie nazwalibyśmy ich „warunkiem identyfikacji”. Zasadniczo postulat nakłada ograniczenia na wspólny rozkładp(x,y) . Oznacza to, że postulat mówi, że jeśli x→y pewne ograniczenia zostaną zachowane w danych, a jeśli y→x inne ograniczenia się utrzymają. Tego rodzaju ograniczenia, które mają implikowalne konsekwencje (nakładają ograniczeniap(y,x) ), pozwalają na kierunkowe odzyskanie danych obserwacyjnych.
Na koniec, wyniki odkryć przyczynowych są nadal bardzo ograniczone i zależą od silnych założeń, zachowaj ostrożność, stosując je w kontekście realnym.
źródło
lm
). Nie wszyscy możemy obejść próbki obserwacyjne z zestawów danych z Tybingi, aby uzyskać pomysł na odkrycie przyczynowe! :)Istnieje wiele różnych podejść do sformalizowania związku przyczynowego (co jest zgodne z zasadniczym sporem filozoficznym dotyczącym związku przyczynowego, który istnieje od stuleci). Popularny jest pod względem potencjalnych wyników. Podejście potencjalne do wyników, zwane modelem przyczynowym Rubina , zakłada, że dla każdego stanu przyczynowego istnieje inna zmienna losowa. Tak,Y1 może być zmienna losowa możliwych wyników z badania klinicznego, jeżeli pacjent przyjmuje badany lek, i Y2 może być zmienna losowa jeśli bierze placebo. Efektem przyczynowym jest różnica między Y1 i Y2 . Jeśli faktycznieY1=Y2 , możemy powiedzieć, że leczenie nie ma wpływu. W przeciwnym razie moglibyśmy powiedzieć, że stan leczenia powoduje wynik.
Związki przyczynowe między zmiennymi można również przedstawić za pomocą kierunkowych wykresów acylicznych , które mają bardzo odmienny smak, ale okazują się matematycznie równoważne z modelem Rubina (Wasserman, 2004, sekcja 17.8).
Wasserman, L. (2004). Wszystkie statystyki: zwięzły kurs wnioskowania statystycznego . New York, NY: Springer. ISBN 978-0-387-40272-7.
źródło
Interwencja to chirurgiczna zmiana zmiennej, która nie wpływa na zmienne, od których zależy. Interwencje zostały rygorystycznie sformalizowane w równaniach strukturalnych i przyczynowych modelach graficznych, ale o ile mi wiadomo, nie ma definicji niezależnej od konkretnej klasy modelu.
We współczesnym podejściu do związku przyczynowego interwencja jest traktowana jako prymitywny obiekt, który definiuje związki przyczynowe (definicja 1). Moim zdaniem jednak interwencja jest odzwierciedleniem i koniecznie spójna z dynamiką symulacji.
źródło