Powiedzmy, że mam tabelę z kolumnami „A”, „B”
Czy istnieje metoda statystyczna pozwalająca ustalić, czy „A” powoduje „B”? Tak naprawdę nie można używać r Pearsona, ponieważ:
- testuje tylko korelację między wartościami
- korelacja nie jest przyczyną
- Wartość r Pearsona może korelować tylko relacje liniowe
Jakie inne opcje mam tutaj?
correlation
causality
chutsu
źródło
źródło
Odpowiedzi:
Dotychczasowe odpowiedzi i komentarze są zasadniczo poprawne na poziomie praktycznym, ale dla kompletności prowadzone są badania nad tak zwanymi modelami przyczynowości opartymi na statystyce bayesowskiej i teorii grafów. Tak więc chociaż ogólna korelacja faktycznie nie implikuje związku przyczynowego, istnieją bardziej złożone modele, które próbują wyeliminować związek przyczynowy. Więcej informacji można znaleźć w książce Causality autorstwa Judei Pearl, ale jest to bardzo trudna matematyka i prawdopodobnie nie jest tym, czego chcesz.
źródło
Istnieje wiele tak zwanych quasi-eksperymentalnych metod, za pomocą których można wiarygodnie spierać się o przyczynowość, nawet jeśli dane są obserwacyjne. Metody te zwykle polegają na znalezieniu źródła egzogenicznej zmienności w twojej zmiennej zainteresowania.
Myślę, że dobry i przystępny przegląd znajduje się w książce „Mostless Econometrics”. Obejmują w zasadzie wszystkie quasi-eksperymentalne metody, w które ludzie (czyli ekonomiści) wierzą (przynajmniej czasami). Nie obejmują one metod wymienionych na przykład przez trb456 (z tego samego powodu: niewielu w nie wierzy).
źródło
Aby ustalić związek przyczynowy, musisz wykonać test randomizacji. Bierzesz badanych i losowo wybierasz połowę z nich, aby uzyskać jakość A, a połowę, aby jej nie mieć. Następnie zobaczysz, czy istnieje statystycznie istotna różnica w jakości B między dwiema grupami.
Ważne jest, aby dokonać losowości przed wykonaniem jakiegokolwiek pomiaru. W szczególności, jeśli otrzymasz zestaw danych zZA i b już zmierzone, nie można ustalić związku przyczynowego.
Zauważ, że wykonanie testu randomizacji może być niemożliwe. Na przykład, jak mógłbyś sprawdzić, czy wzrost jest przyczyną większej wagi? Z pewnością istnieje korelacja między wzrostem a wagą, ale nie można losowo przypisać jednej grupy ludzi do grupy „wysokiej”, a jednej do grupy „krótkiej”. W takim przypadku nie można wykonać testu randomizacji.
źródło
Somers pracuje nad wyjaśnieniem związku między zmiennymi porządkowymi w sposób, który robi współczynnik korelacji Pearsona dla zbiorów danych.
źródło