Jakie teorie przyczynowości powinienem wiedzieć?

16

Jakie teoretyczne podejścia do związku przyczynowego powinienem znać jako statystyczny / ekonometryczny?

Znam (trochę)

Których koncepcji brakuje mi, czy powinienem być świadomy?

Powiązane: Które teorie są podstawą przyczynowości w uczeniu maszynowym?

Przeczytałem te interesujące pytania i odpowiedzi ( 1 , 2 , 3 ), ale myślę, że to inne pytanie. Byłem bardzo zaskoczony, widząc na przykład, że „przyczynowość” nie jest wspomniana w „ Elementy uczenia statystycznego” .

Arne Jonas Warnke
źródło
2
Sprawdź recenzję Andrew Gelmana kilku prac dotyczących związku przyczynowego w AJS: Gelman, A. (2011). Przyczynowość i uczenie się statystyki. American Journal of Sociology, 117 (3), 955-966. DOI: 10.1086 / 662659 . Jest to krótki przegląd przyczynowości w naukach społecznych z konkretnymi odniesieniami do prac Rubina i Pearl, a także niektórych innych. Dobre miejsce do przeszukiwania referencji.
paqmo,
1
Na początek metody Johna Stuarta. en.wikipedia.org/wiki/Mill's_Methods
noumenal
Zobacz mój komentarz pod przyjętą odpowiedzią dotyczącą możliwej błędnej interpretacji związku przyczynowego Grangera.
Richard Hardy,

Odpowiedzi:

17

b

Chociaż niemal bezsporne jest, że przyczyna musi wyprzedzić swój skutek w czasie, aby wyciągnąć wnioski przyczynowe z pierwszeństwem czasu, nadal musisz twierdzić, że nie ma zamieszania wśród innych źródeł fałszywych skojarzeń.

Jeśli chodzi o potencjalne wyniki (Neyman-Rubin) w porównaniu do wykresów przyczynowych / modelowania równań strukturalnych (Pearl), powiedziałbym, że to fałszywy dylemat i powinieneś nauczyć się obu.

Po pierwsze, należy zauważyć, że nie są to przeciwne poglądy na temat związku przyczynowego . Jak ujął to Pearl, istnieje hierarchia dotycząca (wnioskowego) zadań wnioskowania:

  1. Prognozy obserwacyjne
  2. Prognozy pod nadzorem
  3. Kontrfaktyczne

Do pierwszego zadania wystarczy znać wspólny rozkład obserwowanych zmiennych. W przypadku drugiego zadania musisz znać rozkład stawów i strukturę przyczynową. Do ostatniego zadania scenariuszy alternatywnych będziesz potrzebować więcej informacji na temat form funkcjonalnych modelu równania strukturalnego.

Mówiąc o scenariuszach alternatywnych, istnieje formalna równoważność obu perspektyw . Różnica polega na tym, że potencjalne wyniki przyjmują twierdzenia kontrfaktyczne jako prymitywy, a w DAG kontrfaktyczne wydają się pochodzić z równań strukturalnych. Możesz jednak zapytać, czy są one „równoważne”, po co zawracać sobie głowę uczeniem się obu? Ponieważ istnieją różnice pod względem „łatwości” wyrażania i czerpania rzeczy.

Na przykład, spróbuj wyrazić koncepcję M-stronniczości przy użyciu tylko potencjalnych wyników --- nigdy nie widziałem dobrego. Moje dotychczasowe doświadczenie jest takie, że badacze, którzy nigdy nie studiowali grafów, nawet o tym nie wiedzą. Ponadto przekazanie merytorycznych założeń modelu w języku graficznym ułatwi obliczeniowo wyprowadzenie jego empirycznych testowalnych implikacji i udzielenie odpowiedzi na pytania dotyczące identyfikowalności. Z drugiej strony czasami ludziom łatwiej będzie najpierw pomyśleć bezpośrednio o samych scenariuszach alternatywnych i połączyć to z parametrycznymi założeniami, aby odpowiedzieć na bardzo konkretne pytania.

Można powiedzieć o wiele więcej, ale chodzi o to, że powinieneś nauczyć się, jak „mówić w obu językach”. Aby uzyskać informacje, możesz sprawdzić, jak zacząć tutaj.

Carlos Cinelli
źródło
1
Czy możesz podać przykład czegoś, co łatwo wyrazić w kategoriach OP, ale nie w DAG?
Guilherme Duarte
@GuilhermeDuarte na przykład wielkości mediacji obejmujące zagnieżdżone kontrfaktyczne
Carlos Cinelli
3
AGrangerBABb
@RichardHardy Myślę, że masz rację, może idealny kogut, który pije zawsze godzinę przed wschodem słońca, może mieć moc przewidywania wykraczającą poza liniowy model szeregów czasowych wschodu słońca (ponieważ wschód słońca nie jest dokładnie taki sam każdego dnia), ale z idealnym modelem prawdopodobnie nic nie dodaje.
Carlos Cinelli,
Myślę, że przyczynowość Grangera nie sugeruje stosowania gorszych modeli predykcyjnych z tylko historią B, aby uzasadnić potrzebę dodatkowej zmiennej A, a zatem przyczynowości Grangera. Raczej idealnie byłoby dążyć do jak najlepszego modelu, wykorzystując własną historię B, a następnie sprawdzić, czy dodanie A (w jakiejś formie) pomaga przewidzieć B. I oczywiście „idealny kogut” jest raczej utopijną koncepcją. Biorąc to pod uwagę, uważam, że edytowanie odpowiedzi w celu odzwierciedlenia tego może być dobrym pomysłem.
Richard Hardy,