Pytanie: Czy z punktu widzenia statystyki (lub praktyka) można wnioskować o przyczynowości na podstawie wyników skłonności w badaniu obserwacyjnym ( nie w eksperymencie )?
Proszę, nie chcę rozpętać wojny z płomieniami ani fanatycznej debaty.
Kontekst: W ramach naszego programu doktoranckiego statystyką zajmowaliśmy się jedynie wnioskami przyczynowymi za pośrednictwem grup roboczych i kilku sesji tematycznych. Istnieje jednak kilku bardzo znanych badaczy z innych wydziałów (np. HDFS, socjologia), którzy aktywnie z nich korzystają.
Byłem już świadkiem bardzo gorącej debaty na ten temat. Nie mam zamiaru tu zaczynać. To powiedziawszy, jakie referencje napotkałeś? Jakie masz poglądy? Na przykład, jeden argument, który słyszałem przeciwko punktom skłonności jako technice wnioskowania przyczynowego, jest taki, że nigdy nie można wnioskować o przyczynowości z powodu pominięcia zmiennej zmienności - jeśli pominiesz coś ważnego, przerwiesz łańcuch przyczynowy. Czy to problem nie do rozwiązania?
Zastrzeżenie: To pytanie może nie mieć poprawnej odpowiedzi - całkowicie fajne po kliknięciu cw, ale osobiście jestem bardzo zainteresowany odpowiedziami i byłbym zadowolony z kilku dobrych referencji, które zawierają przykłady z prawdziwego świata.
źródło
Pytanie wydaje się obejmować dwie rzeczy, które naprawdę należy rozpatrywać osobno. Po pierwsze, czy można wnioskować o przyczynowości na podstawie badania obserwacyjnego, a na tym można przeciwstawić poglądy, powiedzmy Pearl (2009), który twierdzi, że tak, o ile można odpowiednio modelować proces, w porównaniu z poglądem @propofol, który będzie znaleźć wielu sprzymierzeńców w dyscyplinach eksperymentalnych i którzy mogą dzielić się niektórymi przemyśleniami wyrażonymi w (raczej niejasnym, ale mimo to dobrym) eseju Gerbera i in. (2004). Po drugie, zakładając, że uważasz, że przyczynowość można wywnioskować z danych obserwacyjnych, możesz zastanawiać się, czy metody oceny skłonności są przydatne w tym celu. Metody oceny skłonności obejmują różne strategie warunkowania, a także odwrotne ważenie skłonności. Miłą recenzję podają Lunceford i Davidian (2004).
Trochę zmarszczek: dopasowanie oceny skłonności i ważenie są również wykorzystywane w analizie randomizowanych eksperymentów, gdy na przykład istnieje zainteresowanie obliczeniem „efektów pośrednich”, a także gdy występują problemy z potencjalnie nieprzypadkowym zużyciem lub wypadnięciem ( w takim przypadku to, co masz, przypomina badanie obserwacyjne).
Referencje
Gerber A i in. 2004. „Iluzja uczenia się na podstawie badań obserwacyjnych”. W Shapiro I i wsp., Problems and Methods in the Study of Politics , Cambridge University Press.
Lunceford JK, Davidian M. 2004. „Stratyfikacja i ważenie za pomocą oceny skłonności w ocenie skutków leczenia przyczynowego: badanie porównawcze”. Statystyka w medycynie 23 (19): 2937–2960.
Pearl J. 2009. Causality (2nd Ed.) , Cambridge University Press.
źródło
Konwencjonalna mądrość głosi, że tylko randomizowane próby kontrolowane („prawdziwe” eksperymenty) mogą zidentyfikować przyczynowość.
Nie jest to jednak takie proste.
Jednym z powodów, dla których randomizacja może być niewystarczająca, jest to, że w „małych” próbkach prawo dużej liczby nie jest „wystarczająco silne”, aby zapewnić zrównoważenie wszystkich różnic. Pytanie brzmi: co jest „za małe”, a kiedy zaczyna się „wystarczająco duże”? Saint-Mont (2015) twierdzi tutaj, że „wystarczająco duży” może równie dobrze zacząć się w tysiącach (n> 1000)!
W końcu chodzi o zrównoważenie różnic między grupami, kontrolowanie różnic. Dlatego nawet w eksperymentach należy zachować wielką ostrożność, aby zrównoważyć różnice między grupami. Według obliczeń Saint-Mont (2015) może się zdarzyć, że w mniejszych próbkach można znacznie lepiej dopasować (ręcznie zrównoważone) próbki.
Co do prawdopodobieństwa. Oczywiście prawdopodobieństwo nigdy nie jest w stanie udzielić jednoznacznej odpowiedzi - chyba że prawdopodobieństwo jest ekstremalne (zero lub jeden). Jednak w nauce często mieliśmy do czynienia z sytuacjami, w których nie jesteśmy w stanie udzielić jednoznacznej odpowiedzi, ponieważ rzeczy są trudne. Stąd potrzeba prawdopodobieństwa. Prawdopodobieństwo jest jedynie sposobem wyrażenia naszej niepewności w oświadczeniu. Jako taki jest podobny do logiki; patrz Briggs (2016) tutaj .
Prawdopodobieństwo pomoże nam, ale nie da jednoznacznych odpowiedzi, bez pewności. Ale to jest bardzo przydatne - do wyrażania niepewności.
Należy również zauważyć, że przyczynowość nie jest przede wszystkim kwestią statystyczną. Załóżmy, że dwa sposoby różnią się „znacznie”. Czy to nie znaczy, że zmienna grupująca jest przyczyną różnicy mierzonej zmiennej? Nie (niekoniecznie). Bez względu na to, jakiej konkretnej statystyki się używa - wskaźnik skłonności, wartości p, współczynniki Bayesa i tak dalej - takie metody (praktycznie) nigdy nie wystarczą do uzasadnienia roszczeń przyczynowych.
źródło