Wszyscy wiemy, że mantra „korelacja nie implikuje związku przyczynowego”, która jest wniknięta we wszystkich studentów pierwszego roku statystyki. Istnieje kilka ciekawych przykładów tutaj ilustrujące ideę.
Czasami jednak korelacja nie implikuje związku przyczynowego. Poniższy przykład pochodzi z tej strony Wikipedii
Na przykład można przeprowadzić eksperyment na identycznych bliźniakach, o których wiadomo, że konsekwentnie uzyskują te same oceny w swoich testach. Jeden bliźniak jest wysyłany na studia na sześć godzin, a drugi do parku rozrywki. Jeśli ich wyniki testu nagle się znacznie rozeszły, byłby to mocny dowód na to, że studiowanie (lub pójście do parku rozrywki) miało związek przyczynowy z wynikami testu. W takim przypadku korelacja między wynikami badań a wynikami testów prawie na pewno oznaczałaby związek przyczynowy.
Czy istnieją inne sytuacje, w których korelacja implikuje związek przyczynowy?
źródło
Odpowiedzi:
Korelacja nie jest wystarczająca dla związku przyczynowego. Można obejść przykład z Wikipedii, wyobrażając sobie, że te bliźniaki zawsze oszukiwały w swoich testach, mając urządzenie, które daje im odpowiedzi. Bliźniak, który jedzie do wesołego miasteczka, traci urządzenie, stąd niska klasa.
Dobrym sposobem na wyjaśnienie tych rzeczy jest pomyślenie o strukturze sieci bayesowskiej, która może generować mierzone wielkości, jak zrobił to Pearl w swojej książce Causality . Jego podstawowym celem jest poszukiwanie ukrytych zmiennych. Jeśli istnieje ukryta zmienna, która zdarza się nie zmieniać w mierzonej próbce, korelacja nie implikuje związku przyczynowego. Ujawnij wszystkie ukryte zmienne i masz przyczynę.
źródło
Dodam tylko kilka dodatkowych uwag na temat związku przyczynowego z perspektywy epidemiologicznej . Większość tych argumentów pochodzi z Practical Psychiatric Epidemiology , Prince i in. (2003).
Przyczynowość lub interpretacja przyczynowości są zdecydowanie najtrudniejszymi aspektami badań epidemiologicznych. Badania kohortowe i przekrojowe mogą prowadzić na przykład do pomieszania efektów. Cytując S. Menarda ( Longitudinal Research , Sage University Paper 76, 1991), HB Asher in Causal Modeling (Sage, 1976) początkowo zaproponował spełnienie następującego zestawu kryteriów:
Podczas gdy dwa pierwsze kryteria można łatwo sprawdzić za pomocą badania przekroju poprzecznego lub uporządkowanego w czasie, to drugie można ocenić tylko na podstawie danych podłużnych, z wyjątkiem cech biologicznych lub genetycznych, dla których można przyjąć porządek czasowy bez danych podłużnych. Oczywiście sytuacja staje się bardziej złożona w przypadku nierekurencyjnego związku przyczynowego.
Podoba mi się również poniższa ilustracja (rozdział 13, we wspomnianym wyżej odnośniku), która podsumowuje podejście ogłoszone przez Hill (1965), które obejmuje 9 różnych kryteriów związanych z efektem przyczynowym, cytowanych również przez @James. Pierwotny artykuł był zatytułowany „Środowisko i choroba: związek czy związek przyczynowy?” ( Wersja PDF ).
Wreszcie rozdział 2 najsłynniejszej książki Rothmana, Modern Epidemiology (1998, Lippincott Williams & Wilkins, 2. wydanie), zawiera bardzo kompletną dyskusję na temat związku przyczynowego i wnioskowania przyczynowego, zarówno z perspektywy statystycznej, jak i filozoficznej.
Chciałbym dodać następujące odniesienia (z grubsza zaczerpnięte z internetowego kursu epidemiologicznego), które są również bardzo interesujące:
Wreszcie, przegląd ten oferuje szersze spojrzenie na modelowanie przyczynowe, wnioskowanie przyczynowe w statystykach: przegląd (J Pearl, SS 2009 (3)).
źródło
Sednem twojego pytania jest pytanie „kiedy związek przyczynowy? Nie musi to być tylko korelacja implikująca (lub nie) związek przyczynowy.
Dobra książka na ten temat Johua Angrist i Jorn-Steffen Pischke nazywa się w większości nieszkodliwymi ekonometriami . Zaczynają od ideału eksperymentalnego, w którym jesteśmy w stanie w pewien sposób losowo badać „leczenie”, a następnie przechodzą na alternatywne metody generowania tej randomizacji w celu uzyskania wpływów przyczynowych. Zaczyna się to od badań tzw. Eksperymentów naturalnych.
Jednym z pierwszych przykładów naturalnego eksperymentu stosowanego do identyfikacji związków przyczynowych jest praca Angrista z 1989 r. Pt. „Lifetime Earnings and the Vietnam Era Draft Lottery”. W artykule podjęto próbę oszacowania wpływu służby wojskowej na zarobki dożywotnie. Kluczowym problemem związanym z oszacowaniem jakiegokolwiek skutku przyczynowego jest to, że pewne typy ludzi mogą być bardziej skłonne do zaciągnięcia się, co może zniekształcać każdy pomiar związku. Angrist wykorzystuje naturalny eksperyment stworzony przez loterię z Wietnamu, aby skutecznie „losowo przydzielić” leczenie „służbie wojskowej” grupie mężczyzn.
Kiedy więc mamy związek przyczynowy? W warunkach eksperymentalnych. Kiedy się zbliżamy? W ramach naturalnych eksperymentów. Istnieją również inne techniki, które zbliżają nas do „przyczynowości”, tzn. Są znacznie lepsze niż zwykła kontrola statystyczna. Obejmują one nieciągłość regresji, różnice w różnicach itp.
źródło
Problem występuje również w przypadku odwrotnym, gdy brak korelacji jest wykorzystywany jako dowód braku związku przyczynowego. Ten problem to nieliniowość; patrząc na korelację ludzie zwykle sprawdzają Pearson, który jest tylko wierzchołkiem góry lodowej.
źródło
Twój przykład to kontrolowany eksperyment . Jedyny znany mi kontekst, w którym korelacja może sugerować związek przyczynowy, to eksperyment naturalny .
Zasadniczo, naturalny eksperyment wykorzystuje przypisanie niektórych respondentów do leczenia, które dzieje się naturalnie w prawdziwym świecie. Ponieważ przydzielanie respondentów do grup leczenia i kontrolnych nie jest kontrolowane przez eksperymentatora, stopień, w jakim korelacja implikuje związek przyczynowy, jest być może do pewnego stopnia słabszy.
Zobacz linki wiki, aby uzyskać więcej informacji na temat kontrolowanych / naturalnych eksperymentów.
źródło
Moim zdaniem grupa zadaniowa ds. Statystyki APA dość dobrze to podsumowała
źródło
Wystąpienie Prezydenta Sir Austina Bradforda Hilla do Królewskiego Towarzystwa Medycznego ( Środowisko i Choroba: Stowarzyszenie czy Przyczyna? ) Wyjaśnia dziewięć kryteriów, które pomagają ocenić, czy istnieje związek przyczynowy między dwiema skorelowanymi lub powiązanymi zmiennymi.
Oni są:
źródło
W przykładzie bliźniaków nie tylko korelacja sugeruje przyczynowość, ale także powiązane informacje lub wcześniejsza wiedza.
Załóżmy, że dodam jeszcze jedną informację. Załóżmy, że sumienny bliźniak spędził 6 godzin studiując na egzamin statystyczny, ale z powodu niefortunnego błędu egzamin był w historii. Czy nadal stwierdzilibyśmy, że badanie było przyczyną lepszych wyników?
Określenie przyczynowości jest zarówno pytaniem filozoficznym, jak i naukowym, stąd tendencja do powoływania się na filozofów takich jak David Hume i Karl Popper, gdy omawia się przyczynowość.
Nic dziwnego, że medycyna wniosła znaczący wkład w ustalenie przyczynowości za pomocą heurystyki, takich jak postulaty Kocha dotyczące ustalenia związku przyczynowego między drobnoustrojami a chorobą. Zostały one rozszerzone na „postulaty molekularne Kocha” wymagane do wykazania, że gen w patogenie koduje produkt, który przyczynia się do choroby wywołanej przez patogen.
Niestety nie mogę opublikować hiperłączy rzekomo PONIEWAŻ Jestem nowym użytkownikiem (nieprawda) i nie mam wystarczającej liczby „punktów reputacji”. Prawdziwym powodem jest zgadywanie.
źródło
Sama korelacja nigdy nie oznacza związku przyczynowego. To takie proste.
Ale bardzo rzadko występuje tylko korelacja między dwiema zmiennymi. Często wiesz także o tym, czym są te zmienne, i teorią lub teoriami, sugerującymi, dlaczego może istnieć związek przyczynowy między zmiennymi. Jeśli nie, to kłopotamy się sprawdzeniem korelacji? (Jednak ludzie wydobywający masywne macierze korelacji w celu uzyskania znaczących wyników często nie mają przypadkowej teorii - w przeciwnym razie, po co zawracać sobie głowę wydobywaniem. Przeciwwskazaniem jest to, że często potrzebne są badania, aby uzyskać pomysły na przypadkowe teorie. I tak dalej itd.)
Odpowiedź na powszechną krytykę „Tak, ale to tylko korelacja: nie oznacza to związku przyczynowego”:
źródło
Jeden przydatny wystarczający warunek dla niektórych definicji związku przyczynowego:
Przyczynę można twierdzić, gdy jedną ze skorelowanych zmiennych można kontrolować (możemy bezpośrednio ustawić jej wartość), a korelacja jest nadal obecna.
źródło
Większość algorytmów wykrywania jest zaimplementowana w Tetrad IV
źródło
Powiązane pytanie może brzmieć - pod jakimi warunkami można w wiarygodny sposób wyodrębnić relacje przyczynowe z danych?
Warsztaty NIPS z 2008 r. Próbują odpowiedzieć na to pytanie empirycznie. Jednym z zadań było ustalenie kierunku przyczynowości na podstawie obserwacji par zmiennych, o których wiadomo, że jedna zmienna powoduje inną, a najlepsza metoda była w stanie poprawnie wyodrębnić kierunek przyczynowy w 80% przypadków.
źródło
Niemal na pewno w dobrze zaprojektowanym eksperymencie. (Zaprojektowany, oczywiście, w celu wywołania takiego połączenia ).
źródło
Załóżmy, że uważamy, że czynnik A jest przyczyną zjawiska B. Następnie staramy się go zmieniać, aby zobaczyć, czy B się zmienia. Jeśli B się nie zmienia i jeśli możemy założyć, że wszystko inne pozostało niezmienione, mocne dowody, że A nie jest przyczyną B. Jeśli B się zmienia, nie możemy stwierdzić, że A jest przyczyną, ponieważ zmiana A mogła spowodować zmiana rzeczywistego związku przyczynowego C, która spowodowała zmianę B.
źródło
Zauważyłem, że przy omawianiu paradygmatu empirycznego użyto tutaj „dowodu”. Nie ma takiej rzeczy. Najpierw przychodzi hipoteza, w której idea jest zaawansowana; potem następuje testowanie w „kontrolowanych warunkach” [uwaga a] i jeśli „wystarczający” brak dysproporcji napotkamy , przechodzi do etapu hipotezy...Kropka. Nie ma dowodu, chyba że 1) uda się być przy każdym wystąpieniu tego zdarzenia [uwaga b] i oczywiście 2) ustalić związek przyczynowy. 1) jest nieprawdopodobne w nieskończonym wszechświecie [uwaga, że z natury nie można udowodnić nieskończoności]. Nie herbata; żaden eksperyment nie jest przeprowadzany w całkowicie kontrolowanych warunkach, a im bardziej kontrolowane warunki, tym mniej podobieństwo do zewnętrznego wszechświata z pozornie nieskończonymi liniami przyczynowymi. Uwaga b; pamiętajcie, musieliście doskonale opisać powiedziane „wydarzenie”, co przypuszczalnie oznacza całkowicie poprawny język = prawdopodobnie nie język ludzki. W ostatecznym rozrachunku wszelka przyczyna prawdopodobnie wraca do Pierwszego Wydarzenia. Teraz idź porozmawiać ze wszystkimi z teorią. Tak, uczyłem się formalnie i nieformalnie. Na końcu; nie, bliskość nie oznacza związku przyczynowego ani nawet niczego innego niż tymczasowa korelacja.
źródło
Następnie jest nieobciążonym estymatorem przyczynowy wpływ X w Y (czylib X Y E (b)=B X u E (u | X) = 0 u Y X Y
Bycie bezstronnym jest pożądaną właściwością estymatora, ale chciałbyś również, aby twój estymator był wydajny (niska wariancja) i spójny (dąży prawdopodobnie do prawdziwej wartości). Zobacz założenia Gaussa-Markowa.
źródło