Regresję w nie musi być przyczynowy, jeżeli pominięto zmienne, które mają wpływ zarówno i . Ale jeśli nie w przypadku pominiętych zmiennych i błędu pomiaru, to czy regresja jest przyczyną? To znaczy, czy regresja obejmuje każdą możliwą zmienną?
regression
bias
causality
Esza
źródło
źródło
Odpowiedzi:
Nie, nie, pokażę wam kilka kontrprzykładów.
Pierwszym z nich jest odwrotna przyczyna . Rozważmy, że modelem przyczynowym jestY→ X , gdzie X i Y są standardowymi zmiennymi losowymi gaussowskimi. Następnie E[Y|do(x)]=0 , ponieważ X nie powoduje Y , ale E[Y|x] zależy od X .
Drugi przykład to kontrola zderzaczy (patrz tutaj ). Rozważmy model przyczynowyX→Z←Y , to znaczy X nie powoduje Y a Z jest częstą przyczyną. Pamiętaj jednak, że jeśli uruchomisz regresję obejmującą Z , współczynnik regresji X nie będzie wynosił zero, ponieważ uwarunkowanie wspólnej przyczyny spowoduje powiązanie między Y i X (możesz również zobaczyć tutaj Analiza ścieżki w obecności Zderzak warunkowany ).
Mówiąc bardziej ogólnie, regresjaY na X będzie przyczynowa, jeśli zmienne zawarte w regresji spełniają kryterium backdoora .
źródło
Oprócz ważnej odpowiedzi Carlosa Cinelli na to pytanie istnieje jeszcze kilka powodów, dla których współczynniki regresji mogą nie być przyczynowe.
Po drugie, i związane z tematem odwrotnej przyczynowości, istnieje również ryzyko, że możesz mieć uprzedzenie selekcyjne , tj. Że twoja próbka została wybrana w taki sposób, że nie jest reprezentatywna dla populacji, do której chcesz wyciągnąć wnioski. Ponadto brakujące dane mogą również powodować błąd systematyczny, jeśli dane nie zostaną całkowicie przypadkowo usunięte.
źródło