W „Księdze powodu” Judei Pearl mówi o tym, co nazywa drabiną przyczynową, która jest zasadniczo hierarchią złożoną z różnych poziomów rozumowania przyczynowego. Najniższe dotyczy wzorców asocjacji w obserwowanych danych (np. Korelacja, prawdopodobieństwo warunkowe itp.), Następne skupiają się na interwencji (co się stanie, jeśli celowo zmienimy proces generowania danych w określony sposób?), A trzeci to scenariusz alternatywny (co by się stało w innym możliwym świecie, gdyby coś się wydarzyło lub nie wydarzyło)?
Nie rozumiem, czym różnią się szczeble drugi i trzeci. Jeśli zadamy pytanie alternatywne, czy nie zadajemy po prostu pytania o interwencję w celu zanegowania jakiegoś aspektu obserwowanego świata?
Odpowiedzi:
Nie ma sprzeczności między faktycznym światem a działaniem zainteresowania na poziomie interwencyjnym. Na przykład palenie do dziś i zmuszanie do rzucenia palenia od jutra nie jest ze sobą sprzeczne, chociaż można powiedzieć, że jedno „zaprzecza” drugiemu. Ale teraz wyobraź sobie następujący scenariusz. Wiesz, Joe, dożywotni palacz, który ma raka płuc, i zastanawiasz się: co jeśli Joe nie palił przez trzydzieści lat, czy byłby dzisiaj zdrowy? W tym przypadku mamy do czynienia z tą samą osobą w tym samym czasie, wyobrażając sobie scenariusz, w którym działanie i wynik są w bezpośredniej sprzeczności ze znanymi faktami.
Tak więc główna różnica w interwencjach i scenariuszach alternatywnych polega na tym, że podczas gdy w interwencjach pytasz, co stanie się średnio, jeśli wykonasz działanie, w scenariuszach alternatywnych pytasz, co by się stało, gdybyś podjął inny kierunek działania w konkretnej sytuacji , biorąc pod uwagę, że masz informacje o tym, co się faktycznie wydarzyło. Pamiętaj, że skoro już wiesz, co się wydarzyło w prawdziwym świecie, musisz zaktualizować swoje informacje o przeszłości w świetle zaobserwowanych dowodów.
Te dwa rodzaje zapytań są matematycznie odrębne, ponieważ wymagają odpowiedzi na różnych poziomach informacji (kontrfaktycy potrzebują więcej informacji) i jeszcze bardziej rozbudowanego języka do sformułowania!
Dzięki informacjom potrzebnym do udzielenia odpowiedzi na pytania na poziomie 3 możesz odpowiedzieć na pytania na poziomie 2, ale nie na odwrót. Mówiąc ściślej, nie można odpowiadać na pytania kontrfaktyczne przy użyciu jedynie informacji interwencyjnych. Przykłady, w których dochodzi do starć interwencji i scenariuszy alternatywnych, podano już tutaj w CV, zobacz ten post i ten post . Jednak ze względu na kompletność podam tutaj również przykład.
Poniższy przykład można znaleźć w Przyczynowości, sekcja 1.4.4.
Na to pytanie nie można odpowiedzieć tylko danymi interwencyjnymi, które posiadasz. Dowód jest prosty: mogę stworzyć dwa różne modele przyczynowe, które będą miały te same rozkłady interwencyjne, ale różne rozkłady alternatywne. Oba są przedstawione poniżej:
Należy zauważyć, że w pierwszym modelu leczenie nie ma wpływu na nikogo, dlatego odsetek pacjentów, którzy zmarli podczas leczenia, którzy wyzdrowiliby, gdyby nie podjęli leczenia, wynosi zero.
Jednak w drugim modelu leczenie dotyczy każdego pacjenta i mamy mieszaninę dwóch populacji, w których średni efekt przyczynowy okazuje się zerowy. W tym przykładzie ilość alternatywna wynosi teraz 100% - w modelu 2 wszyscy pacjenci, którzy zmarli w trakcie leczenia, wyzdrowialiby, gdyby nie podjęli leczenia.
Tak więc istnieje wyraźne rozróżnienie między szczeblem 2 a szczeblem 3. Jak pokazuje przykład, nie można odpowiadać na pytania kontrfaktyczne za pomocą samych informacji i założeń dotyczących interwencji. Wyjaśnia to trzy kroki obliczania scenariusza alternatywnego:
Obliczenia nie będzie możliwe bez pewnych informacji funkcjonalnych na temat modelu przyczynowego lub bez niektórych informacji na temat ukrytych zmiennych.
źródło
Oto odpowiedź Judei Pearl na Twitterze :
źródło