Różnica między szczeblami drugim i trzecim w Drabinie związku przyczynowego

12

W „Księdze powodu” Judei Pearl mówi o tym, co nazywa drabiną przyczynową, która jest zasadniczo hierarchią złożoną z różnych poziomów rozumowania przyczynowego. Najniższe dotyczy wzorców asocjacji w obserwowanych danych (np. Korelacja, prawdopodobieństwo warunkowe itp.), Następne skupiają się na interwencji (co się stanie, jeśli celowo zmienimy proces generowania danych w określony sposób?), A trzeci to scenariusz alternatywny (co by się stało w innym możliwym świecie, gdyby coś się wydarzyło lub nie wydarzyło)?

Nie rozumiem, czym różnią się szczeble drugi i trzeci. Jeśli zadamy pytanie alternatywne, czy nie zadajemy po prostu pytania o interwencję w celu zanegowania jakiegoś aspektu obserwowanego świata?

dsaxton
źródło
Czy to naprawdę na temat? Pytanie z ciekawości
Firebug
5
@ Firebug jest przyczynowość na temat? Jeśli chcesz obliczyć prawdopodobieństwo wystąpienia scenariusza alternatywnego (np. Prawdopodobieństwo, że określony lek wystarczał na czyjąś śmierć), musisz to zrozumieć.
Carlos Cinelli,

Odpowiedzi:

13

Nie ma sprzeczności między faktycznym światem a działaniem zainteresowania na poziomie interwencyjnym. Na przykład palenie do dziś i zmuszanie do rzucenia palenia od jutra nie jest ze sobą sprzeczne, chociaż można powiedzieć, że jedno „zaprzecza” drugiemu. Ale teraz wyobraź sobie następujący scenariusz. Wiesz, Joe, dożywotni palacz, który ma raka płuc, i zastanawiasz się: co jeśli Joe nie palił przez trzydzieści lat, czy byłby dzisiaj zdrowy? W tym przypadku mamy do czynienia z tą samą osobą w tym samym czasie, wyobrażając sobie scenariusz, w którym działanie i wynik są w bezpośredniej sprzeczności ze znanymi faktami.

Tak więc główna różnica w interwencjach i scenariuszach alternatywnych polega na tym, że podczas gdy w interwencjach pytasz, co stanie się średnio, jeśli wykonasz działanie, w scenariuszach alternatywnych pytasz, co by się stało, gdybyś podjął inny kierunek działania w konkretnej sytuacji , biorąc pod uwagę, że masz informacje o tym, co się faktycznie wydarzyło. Pamiętaj, że skoro już wiesz, co się wydarzyło w prawdziwym świecie, musisz zaktualizować swoje informacje o przeszłości w świetle zaobserwowanych dowodów.

Te dwa rodzaje zapytań są matematycznie odrębne, ponieważ wymagają odpowiedzi na różnych poziomach informacji (kontrfaktycy potrzebują więcej informacji) i jeszcze bardziej rozbudowanego języka do sformułowania!

Dzięki informacjom potrzebnym do udzielenia odpowiedzi na pytania na poziomie 3 możesz odpowiedzieć na pytania na poziomie 2, ale nie na odwrót. Mówiąc ściślej, nie można odpowiadać na pytania kontrfaktyczne przy użyciu jedynie informacji interwencyjnych. Przykłady, w których dochodzi do starć interwencji i scenariuszy alternatywnych, podano już tutaj w CV, zobacz ten post i ten post . Jednak ze względu na kompletność podam tutaj również przykład.

Poniższy przykład można znaleźć w Przyczynowości, sekcja 1.4.4.

x=1x=0y=0y=1P.(y|x)=0,5   x,y

P.(Y=1|reo(X=1))-P.(Y=1|reo(X=0)=0

P.(Y0=0|X=1,Y=1)

Na to pytanie nie można odpowiedzieć tylko danymi interwencyjnymi, które posiadasz. Dowód jest prosty: mogę stworzyć dwa różne modele przyczynowe, które będą miały te same rozkłady interwencyjne, ale różne rozkłady alternatywne. Oba są przedstawione poniżej:

wprowadź opis zdjęcia tutaj

UP.(y,x)

Należy zauważyć, że w pierwszym modelu leczenie nie ma wpływu na nikogo, dlatego odsetek pacjentów, którzy zmarli podczas leczenia, którzy wyzdrowiliby, gdyby nie podjęli leczenia, wynosi zero.

Jednak w drugim modelu leczenie dotyczy każdego pacjenta i mamy mieszaninę dwóch populacji, w których średni efekt przyczynowy okazuje się zerowy. W tym przykładzie ilość alternatywna wynosi teraz 100% - w modelu 2 wszyscy pacjenci, którzy zmarli w trakcie leczenia, wyzdrowialiby, gdyby nie podjęli leczenia.

Tak więc istnieje wyraźne rozróżnienie między szczeblem 2 a szczeblem 3. Jak pokazuje przykład, nie można odpowiadać na pytania kontrfaktyczne za pomocą samych informacji i założeń dotyczących interwencji. Wyjaśnia to trzy kroki obliczania scenariusza alternatywnego:

  1. P.(u)P.(u|mi)
  2. reo(x))
  3. Y

Obliczenia nie będzie możliwe bez pewnych informacji funkcjonalnych na temat modelu przyczynowego lub bez niektórych informacji na temat ukrytych zmiennych.

Carlos Cinelli
źródło
Ciekawa odpowiedź! Kilka dalszych działań: 1) Mówisz „ Dzięki informacjom szczebla 3 możesz odpowiedzieć na pytania szczebla 2, ale nie na odwrót ”. Ale w twoim przykładzie palenia nie rozumiem, jak wiedza, czy Joe byłby zdrowy, gdyby nigdy nie palił, odpowiada na pytanie „Czy byłby zdrowy, gdyby rzucił jutro po 30 latach palenia”. Wydają się być odrębnymi pytaniami, więc myślę, że coś mi umknęło.
mkt - Przywróć Monikę
Również twój kolejny przykład opiera się na 2 nieobserwowanych zmiennych, które są nielosowo rozmieszczone między leczeniem i kontrolą. Ale opisałeś to jako eksperyment randomizowany - czyż nie jest to przypadek złej randomizacji? Przy odpowiedniej randomizacji nie widzę dwóch różnych rezultatów, chyba że brakuje mi czegoś podstawowego.
mkt - Przywróć Monikę
@mkt od ostatniego do pierwszego. Nieobserwowana zmienna jest losowo rozłożona między leczoną i kontrolną, masz dokładnie 50% każdej kategorii uw obu ramionach. Przez informacje rozumiemy częściową specyfikację modelu potrzebną do odpowiedzi na zapytania alternatywne, a nie odpowiedź na określone zapytanie. Aby odpowiedzieć na alternatywne pytania, potrzebujesz struktury przyczynowej + pewnych informacji funkcjonalnych lub informacji o rozkładzie ukrytych zmiennych.
Carlos Cinelli,
0

Oto odpowiedź Judei Pearl na Twitterze :

Czytelnicy pytają: dlaczego interwencja (szczebel 2) różni się od scenariusza alternatywnego (szczebel 3)? Czy interwencja nie neguje niektórych aspektów obserwowanego świata?

Odp. Interwencje zmieniają się, ale nie są sprzeczne z obserwowanym światem, ponieważ świat przed i po interwencji pociąga za sobą zmienne odrębne w czasie. Natomiast „Gdybym nie żył” przeczy znanym faktom. Aby zapoznać się z ostatnią dyskusją, zobacz tę dyskusję .

Uwaga: Zarówno grupa przyczynowa Harvarda, jak i potencjalna struktura wyników Rubina nie odróżniają szczebla 2 od szczebla 3.

Wierzę, że jest to zakorzeniony w kulturze opór, który zostanie naprawiony w przyszłości. Wywodzi się z początków obu ram w metaforze „jakby losowej”, w przeciwieństwie do fizycznej „słuchania” metafory #Bookofwhy

Benjamin Crouzier
źródło