Statystyki i wnioskowanie przyczynowe?

51

W swoim artykule z 1984 r. „Statystyka i wnioskowanie przyczynowe” Paul Holland podniósł jedno z najbardziej podstawowych pytań w statystyce:

Co model statystyczny może powiedzieć o związku przyczynowym?

Doprowadziło to do jego motto:

BRAK PRZYCZYN BEZ MANIPULACJI

co podkreślało znaczenie ograniczeń wokół eksperymentów uwzględniających związek przyczynowy. Andrew Gelman mówi podobnie :

„Aby dowiedzieć się, co się stanie, gdy coś zmienisz, musisz to zmienić.” ... Są rzeczy, których uczysz się na temat zaburzania systemu, których nigdy nie dowiesz się na podstawie biernej obserwacji.

Jego pomysły zostały streszczone w tym artykule .

Jakie należy wziąć pod uwagę wnioskowanie przyczynowe na podstawie modelu statystycznego?

Shane
źródło
2
świetne pytanie: zobacz także pokrewne pytanie dotyczące korelacji i związku przyczynowego stats.stackexchange.com/questions/534/…
Anglim
5
Za dużo do powiedzenia. Ale możesz przeczytać książkę Pearl „Causality” (2002, ale nowsza 2. edycja) lub książkę Hernana i Robinsa „Causal Inference” (2015, bezpłatny elektroniczny szkic online, jeśli szukasz).

Odpowiedzi:

28

To szerokie pytanie, ale biorąc pod uwagę cytat Boxa, Huntera i Huntera, to prawda, myślę, że sprowadza się to do tego

  1. Jakość projektu eksperymentalnego:

    • randomizacja, rozmiary próbek, kontrola czynników zakłócających, ...
  2. Jakość wykonania projektu:

    • przestrzeganie protokołu, błąd pomiaru, przetwarzanie danych, ...
  3. Jakość modelu dokładnie odzwierciedlająca projekt:

    • struktury blokujące są dokładnie reprezentowane, odpowiednie stopnie swobody są powiązane z efektami, estymatory są obiektywne, ...

Na ryzyko stwierdzenia oczywistości postaram się trafić w kluczowe punkty każdego z nich:

  1. jest dużym subpola statystyki, ale w najbardziej podstawowej formie myślę, że sprowadza się to do tego, że dokonując wnioskowania przyczynowego, najlepiej zaczynamy od identycznych jednostek, które są monitorowane w identycznych środowiskach innych niż przypisane do leczenia. Wszelkie systematyczne różnice między grupami po przypisaniu są następnie logicznie przypisywane do leczenia (możemy wnioskować o przyczynie). Ale świat nie jest tak ładny, a jednostki różnią się przed leczeniem, a badania podczas eksperymentów nie są doskonale kontrolowane. Tak więc „kontrolujemy, co możemy i randomizujemy to, czego nie możemy”, co pomaga zapewnić, że nie będzie systematycznego uprzedzenia z powodu zamieszania, które kontrolowaliśmy lub randomizowaliśmy. Jednym z problemów jest to, że eksperymenty bywają trudne (lub niemożliwe) i drogie, a opracowano wiele różnych projektów w celu wydajnego wydobywania jak największej ilości informacji w możliwie dokładnie kontrolowanym otoczeniu, biorąc pod uwagę koszty. Niektóre z nich są dość rygorystyczne (np. W medycynie badanie z podwójnie ślepą próbą, randomizowane, kontrolowane placebo), a inne mniej (np. Różne formy „quasi-eksperymentów”).

  2. to także duży problem, o którym statystycy na ogół nie myślą… chociaż powinniśmy. W stosowanej pracy statystycznej pamiętam przypadki, w których „efekty” znalezione w danych były fałszywymi skutkami niespójności w gromadzeniu lub przetwarzaniu danych. Zastanawiam się również, jak często informacje na temat rzeczywistych przyczynowych skutków zainteresowania są tracone z powodu tych problemów (uważam, że studenci nauk stosowanych na ogół odbywają niewiele szkoleń dotyczących sposobów, w jaki dane mogą zostać uszkodzone - ale zaczynam od tematu ...)

  3. to kolejny duży temat techniczny i kolejny niezbędny krok w obiektywnym wnioskowaniu przyczynowym. Do pewnego stopnia jest to załatwione, ponieważ tłum projektantów wspólnie opracowuje projekty i modele (ponieważ celem jest wnioskowanie z modelu, atrybuty estymatorów sterują projektem). Ale to nas do tej pory prowadzi tylko do tego, że w „prawdziwym świecie” ostatecznie analizujemy dane eksperymentalne z projektów innych niż podręcznikowe, a następnie musimy intensywnie zastanowić się nad takimi rzeczami, jak odpowiednia kontrola i jak powinny wejść do modelu i jakie są związane stopnie powinna istnieć wolność i czy spełnione są założenia, jeśli nie, to w jaki sposób dostosować naruszenia i jak solidne są estymatory w stosunku do wszelkich pozostałych naruszeń i ...

W każdym razie, mam nadzieję, że niektóre z powyższych pomagają w rozważaniach nad wnioskami przyczynowymi na podstawie modelu. Czy zapomniałem czegoś dużego?

Kingsford Jones
źródło
3
Ogromny plus jeden za punkt 2. Poza tym, że przeszedłem szkolenie w zakresie ochrony ludzi, nigdy nie przeszedłem najmniejszego szkolenia w zakresie gromadzenia i przechowywania danych. Właściwe zbieranie danych jest znacznie ważniejsze niż analiza.
Matt Parker,
Chciałbym też odpowiedzieć, ale obawiam się, że nie ma już nic więcej do dodania do tego, co powiedział Kingsford.
Joris Meys,
7

Oprócz powyższej doskonałej odpowiedzi istnieje metoda statystyczna, która może przybliżyć cię do wykazania związku przyczynowego. To przyczynowość Grangera pokazuje, że jedna zmienna niezależna występująca przed zmienną zależną ma wpływ przyczynowy lub nie. Przedstawiam tę metodę w łatwej do zrozumienia prezentacji pod następującym linkiem:

http://www.slideshare.net/gaetanlion/granger-causality-presentation

Stosuję również tę metodę do testowania konkurencyjnych teorii makroekonomicznych: http://www.slideshare.net/gaetanlion/economic-theory-testing-presentation

Pamiętaj, że ta metoda nie jest doskonała. Potwierdza to tylko, że pewne zdarzenia zdarzają się przed innymi i że wydają się one mieć spójny związek kierunkowy. Wydaje się, że pociąga to za sobą prawdziwą przyczynowość, ale nie zawsze tak jest. Poranne wezwanie koguta nie powoduje wschodu słońca.

Sympa
źródło
4

Co model statystyczny może powiedzieć o związku przyczynowym? Jakie należy wziąć pod uwagę wnioskowanie przyczynowe na podstawie modelu statystycznego?

Pierwszą rzeczą do wyjaśnienia jest to, że nie można wnioskować o przyczynach na podstawie czysto statystycznego modelu. Żaden model statystyczny nie może nic powiedzieć o związku przyczynowym bez założeń przyczynowych. Oznacza to, że do wnioskowania przyczynowego potrzebny jest model przyczynowy .

Nawet w czymś uważanym za złoty standard, takim jak Randomized Control Trials (RCT), musisz poczynić założenia przyczynowe, aby kontynuować. Pozwól mi to wyjaśnić. Załóżmy na przykład, że to procedura randomizacji, to leczenie odsetek, a to wynik zainteresowania. Zakładając idealny RCT, zakładasz, że:ZXY

wprowadź opis zdjęcia tutaj

W tym przypadku więc wszystko działa dobrze. Przypuszczam jednak, trzeba niedoskonałe zgodności uzyskanej w przeklętego relacji między i . Następnie twój RCT wygląda następująco:P(Y|do(X))=P(Y|X)XY

wprowadź opis zdjęcia tutaj

Nadal możesz zrobić zamiar leczenia. Ale jeśli chcesz oszacować rzeczywisty efekt rzeczy nie są już proste. Jest to ustawienie zmiennej instrumentalnej i możesz być w stanie powiązać lub nawet wskazać efekt, jeśli przyjmiesz pewne założenia parametryczne .X

To może się jeszcze bardziej skomplikować. Mogą występować problemy z błędami pomiaru, uczestnicy mogą zrezygnować z badania lub nie postępować zgodnie z instrukcjami, między innymi. Musisz założyć, w jaki sposób te rzeczy są powiązane z postępowaniem z wnioskowaniem. W przypadku „czysto” danych obserwacyjnych może to być bardziej problematyczne, ponieważ zwykle badacze nie mają dobrego pojęcia o procesie generowania danych.

Stąd, aby wyciągać wnioski przyczynowe z modeli, należy oceniać nie tylko jego założenia statystyczne, ale przede wszystkim jego założenia przyczynowe. Oto kilka typowych zagrożeń dla analizy przyczynowej:

  • Niekompletne / nieprecyzyjne dane
  • Docelowa przyczynowo-skutkowa wielkość zainteresowania nie jest dobrze zdefiniowana (Jaki jest efekt przyczynowy, który chcesz zidentyfikować? Jaka jest populacja docelowa?)
  • Zakłócanie (niezauważone pomyłki)
  • Błąd selekcji (autoselekcja, okrojone próbki)
  • Błąd pomiaru (który może powodować zamieszanie, a nie tylko hałas)
  • Błędna specyfikacja (np. Niewłaściwa forma funkcjonalna)
  • Problemy z zewnętrzną wiarygodnością (błędne wnioskowanie do populacji docelowej)

Czasami twierdzenie o braku tych problemów (lub twierdzenie, że rozwiązano te problemy) może być poparte projektem samego badania. Dlatego dane eksperymentalne są zwykle bardziej wiarygodne. Czasami jednak ludzie przejmują te problemy albo teorią, albo dla wygody. Jeśli teoria jest miękka (jak w naukach społecznych), trudniej będzie wyciągać wnioski według wartości nominalnej.

Ilekroć myślisz, że istnieje założenie, którego nie można poprzeć, powinieneś ocenić, jak wrażliwe są wnioski na prawdopodobne naruszenia tych założeń - zwykle nazywa się to analizą wrażliwości.

Carlos Cinelli
źródło
Czy równoważne byłoby zastąpienie przerywanej dwukierunkowej strzałki dwiema jednokierunkowymi strzałkami z dodatkowego węzła?
Taylor,
@Taylor tak, ukryty (nieobserwowany) dodatkowy węzeł.
Carlos Cinelli,