Obecnie czytam pracę Pearl (Pearl, 2009, 2. wydanie) na temat przyczynowości i walki o ustalenie związku między nieparametryczną identyfikacją modelu a faktycznym oszacowaniem. Niestety sam Pearl milczy na ten temat.
Na przykład mam na myśli prosty model z przyczynową ścieżką, oraz zamieszanie, które wpływa na wszystkie zmienne , i . Dodatkowo, i są powiązane z nieobserwowanymi wpływami, . Dzięki regułom rachunku różniczkowego wiem, że rozkład prawdopodobieństwa po interwencji (dyskretny) wynika z:
Wiem, zastanawiam się, jak mogę oszacować tę ilość (nieparametrycznie lub wprowadzając założenia parametryczne)? Zwłaszcza w przypadku, gdyjest zbiorem kilku mylących zmiennych, a wielkości odsetek są ciągłe. Szacowanie, że wspólny rozkład danych przed interwencją wydaje się w tym przypadku bardzo niepraktyczny. Czy ktoś zna zastosowanie metod Pearl, które rozwiązują te problemy? Byłbym bardzo szczęśliwy z powodu wskaźnika.
Odpowiedzi:
To jest bardzo dobre pytanie. Najpierw sprawdźmy, czy twoja formuła jest poprawna. Podane informacje odpowiadają następującemu modelowi przyczynowemu:
I jak powiedziałeś, możemy uzyskać oszacowanieP(Y|do(X)) stosując zasady rachunku różniczkowego. W R możemy to łatwo zrobić z pakietem
causaleffect
. Najpierw ładujemy,igraph
aby utworzyć obiekt z proponowanym diagramem przyczynowym:Gdzie pierwsze dwa terminyX i Y a pozostałe terminy reprezentują skierowane krawędzie, o których wspomniałeś.
X-+Y, Y-+X
reprezentują nieobserwowane pomieszaniaNastępnie prosimy o nasze szacunki:
Co rzeczywiście pokrywa się z twoją formułą - przypadek drzwi wejściowych z zaobserwowanym pomieszaniem.
Przejdźmy teraz do części dotyczącej szacowania. Zakładając liniowość (i normalność), rzeczy są znacznie uproszczone. Zasadniczo chcesz oszacować współczynniki ścieżkiX→Z→Y .
Symulujmy niektóre dane:
Zwróć uwagę w naszej symulacji na prawdziwy przyczynowo-skutkowy efekt zmianyX na Y wynosi 21. Możesz to oszacować, uruchamiając dwie regresje. Pierwszy Y∼Z+W+X uzyskać efekt Z na Y i wtedy Z∼X+W uzyskać efekt X na Z . Twoje oszacowanie będzie iloczynem obu współczynników:
Aby wyciągnąć wniosek, możesz obliczyć (asymptotyczny) błąd standardowy produktu:
Które możesz wykorzystać do testów lub przedziałów ufności:
Możesz także wykonać (nie / pół) szacowanie parametrów, postaram się zaktualizować tę odpowiedź, w tym inne procedury później.
źródło