Istnieje stare powiedzenie: „Korelacja nie oznacza związku przyczynowego”. Kiedy uczę, zwykle ilustruję ten punkt w następujących standardowych przykładach:
- liczba bocianów i wskaźnik urodzeń w Danii;
- liczba księży w Ameryce i alkoholizm;
- na początku XX wieku zauważono silną korelację między „liczbą radiotelefonów” a „liczbą osób przebywających w zakładach dla obłąkanych”
- i mój ulubiony: piraci powodują globalne ocieplenie .
Jednak nie mam żadnych odniesień do tych przykładów i chociaż są zabawne, są oczywiście fałszywe.
Czy ktoś ma jakieś inne dobre przykłady?
correlation
teaching
csgillespie
źródło
źródło
Odpowiedzi:
Przydatne może być wyjaśnienie, że „przyczyny” to relacja asymetryczna (X powoduje, że Y różni się od Y powoduje X), podczas gdy „koreluje z” to relacja symetryczna.
Na przykład populacja bezdomnych i wskaźnik przestępczości mogą być skorelowane, ponieważ oba są zwykle wysokie lub niskie w tych samych lokalizacjach. Równie słuszne jest stwierdzenie, że populacja bezdomnych jest skorelowana ze wskaźnikiem przestępczości lub wskaźnik przestępczości jest skorelowany z populacją bezdomnych. Stwierdzenie, że przestępstwo powoduje bezdomność lub populacja bezdomnych powoduje przestępstwo, to różne stwierdzenia. A korelacja nie oznacza, że jedno z nich jest prawdziwe. Na przykład przyczyną może być trzecia zmienna, taka jak nadużywanie narkotyków lub bezrobocie.
Matematyka statystyki nie jest dobra w identyfikowaniu przyczyn, które wymagają innej formy oceny.
źródło
Moje ulubione:
1) Im więcej strażaków zostaje wysłanych do ognia, tym więcej wyrządzonych szkód.
2) Dzieci, które otrzymają korepetycje, otrzymają gorsze oceny niż dzieci, które nie otrzymają korepetycji
i (to mój najlepszy)
3) We wczesnych latach szkoły podstawowej znak astrologiczny jest skorelowany z ilorazem inteligencji, ale korelacja ta słabnie z wiekiem i znika w wieku dorosłym.
źródło
Zawsze lubiłem ten:
źródło: http://pubs.acs.org/doi/abs/10.1021/ci700332k
źródło
Czasami wystarcza korelacja. Na przykład w ubezpieczeniach samochodowych męscy kierowcy są skorelowani z większą liczbą wypadków, więc firmy ubezpieczeniowe naliczają je częściej. W żaden sposób nie można tego sprawdzić pod kątem związku przyczynowego. Nie można eksperymentalnie zmieniać płci kierowców. Google zarobił setki miliardów dolarów, nie dbając o związek przyczynowy.
Aby znaleźć związek przyczynowy, na ogół potrzebujesz danych eksperymentalnych, a nie danych obserwacyjnych. Chociaż z ekonomicznego punktu widzenia często używają obserwowanych „szoków” w systemie, aby sprawdzić przyczynowość, na przykład jeśli dyrektor generalny umiera nagle, a cena akcji rośnie, można założyć przyczynę.
Korelacja jest warunkiem koniecznym, ale niewystarczającym. Wykazanie związku przyczynowego wymaga kontr-faktów.
źródło
Mam kilka przykładów, które lubię używać.
Badając przyczynę przestępczości w Nowym Jorku w latach 80., kiedy próbowali posprzątać miasto, naukowiec stwierdził silną korelację między liczbą poważnych przestępstw i ilością lodów sprzedawanych przez sprzedawców ulicznych! (Jaka jest przyczyna i jaki jest skutek?) Oczywiście, istniała nieobserwowana zmienna powodująca jedno i drugie. Lata to okres największej przestępczości i sprzedaży większości lodów.
Rozmiar dłoni jest ujemnie skorelowany z tym, jak długo będziesz żyć (naprawdę!). W rzeczywistości kobiety mają zwykle mniejsze dłonie i żyją dłużej.
[Mój ulubiony] Kilka lat temu słyszałem o badaniu, w którym stwierdzono, że ilość napoju alkoholowego wypijanego przez osobę jest pozytywnie skorelowana z prawdopodobieństwem otyłości.(Powiedziałem sobie - to ma sens, ponieważ musi to być spowodowane tym, że ludzie piją słodką sodę i spożywają te wszystkie puste kalorie.) Kilka dni później pojawiły się dalsze szczegóły. Prawie cała korelacja wynikała ze zwiększonego spożycia dietetycznych napojów bezalkoholowych. (To rozwaliło moją teorię!) Więc w jaki sposób przyczyna? Czy dietetyczne napoje bezalkoholowe powodują zwiększenie masy ciała, czy też zwiększenie masy ciała powoduje wzrost spożycia napojów bezalkoholowych? (Zanim dojdziesz do wniosku, że to ten ostatni, zobacz badanie, w którym kontrolowane eksperymenty na szczurach wykazały, że grupa, która otrzymywała jogurt ze sztucznym słodzikiem, przybrała na wadze więcej niż grupa, która otrzymała normalny jogurt.) Dwie referencje: Pij więcej napojów dietetycznych , Przybrać na wadze? ; Dietetyczne napoje gazowane związane z otyłością. Myślę, że wciąż próbują rozwiązać ten problem.
źródło
Liczba nagród Nobla wygranych przez kraj (dostosowując się do liczby ludności) dobrze koreluje ze spożyciem czekolady na mieszkańca. ( New England Journal of Medicine )
źródło
Chociaż jest to raczej przykład problemu wielu porównań, jest to również dobry przykład niewłaściwie przypisanego związku przyczynowego:
Rugby (religia Walii) i jego wpływ na kościół katolicki: czy papież Benedykt XVI powinien się martwić?
źródło
Istnieją dwa aspekty tego post hoc ergo propter hoc, które chciałbym omówić: (i) odwrotna przyczynowość i (ii) endogeniczność
Przykład „możliwej” odwrotnej przyczynowości: Picie społeczne i zarobki - pijacy zarabiają więcej pieniędzy według Bethany L. Peters i Edwarda Stringhama (2006. „No Booze? You Can Lose: Dlaczego pijący zarabiają więcej pieniędzy niż napoje bezalkoholowe”, Journal of Labor Research, Transaction Publishers, vol. 27 (3), strony 411-421, czerwiec). A może ludzie, którzy zarabiają więcej pieniędzy, piją więcej, ponieważ mają większy dochód do dyspozycji lub z powodu stresu? To świetny artykuł do omówienia z różnych powodów, w tym błędu pomiaru, błędu odpowiedzi, związku przyczynowego itp.
Przykład „możliwej” endogeniczności: równanie Mincer'a tłumaczy zarobki z logów wykształceniem, doświadczeniem i doświadczeniem do kwadratu. Istnieje długa literatura na ten temat. Ekonomiści pracy chcą oszacować związek przyczynowo-skutkowy edukacji z zarobkami, ale być może edukacja ma charakter endogenny, ponieważ „zdolność” może zwiększyć poziom wykształcenia, jaki jednostka ma (poprzez obniżenie kosztów jego uzyskania) i może prowadzić do wzrostu zarobków, niezależnie od Poziom wykształcenia. Potencjalnym rozwiązaniem tego problemu może być zmienna instrumentalna. Książka Angrista i Pischke'a „Głównie nieszkodliwa ekonometria” omawia to i odnosi się do tematów z dużą szczegółowością i jasnością.
Inne głupie przykłady, na które nie mam poparcia, to: - Liczba telewizorów na mieszkańca i liczba śmiertelności. Wyślijmy więc telewizory do krajów rozwijających się. Oczywiście oba są endogenne dla czegoś takiego jak PKB. - Liczba ataków rekinów i sprzedaży lodów. Oba są endogenne dla temperatury?
Lubię też opowiadać okropny żart o szaleńcu i pająku. Szalony wędruje po korytarzach azylu pająkiem, który nosi w dłoni. Widzi lekarza i mówi: „Patrz doktorze, mogę rozmawiać z pająkami. Patrz na to.” Pająk, idź w lewo! ”Pająk przesuwa się w lewo. Kontynuuje:„ Pająk, idź w prawo. ”Pająk przemierza z prawej strony. Lekarz odpowiada: „Interesujące, może powinniśmy porozmawiać o tym podczas następnej sesji grupowej.” Szaleniec odpowiada: „To nic, doktorze. Zobacz to. ”Ściąga nogi każdego pająka jeden po drugim, a następnie krzyczy:„ Pająku, idź w lewo! ”Pająk leży nieruchomo na dłoni, a wariat zwraca się do lekarza i konkluduje:„ Jeśli zdejmiesz pająka nogi ogłuchnie. ”
źródło
Najlepsza, której mnie nauczyłem, to liczba utopień, a sprzedaż lodów może być bardzo skorelowana, ale to nie oznacza, że jedna powoduje drugą. Utonięcia i sprzedaż lodów są oczywiście wyższe w miesiącach letnich, gdy jest ładna pogoda. Powoduje je trzecia zmienna, czyli dobra pogoda.
źródło
Jako uogólnienie „piraci powodują globalne ocieplenie”: Wybierz dowolne dwie wielkości, które (monotonicznie) rosną lub maleją z czasem i powinieneś zobaczyć pewną korelację.
źródło
Możesz spędzić kilka minut w Google Correlate i wymyślić wszelkiego rodzaju fałszywe korelacje.
źródło
Pracuję ze studentami w nauczaniu korelacji vs związku przyczynowego na moich zajęciach Algebra One. Badamy wiele możliwych przykładów. Uznałem, że przydatny jest artykuł „Niemowlęta w pakiecie i niebezpieczne lody: puzzle korelacyjne” od nauczyciela matematyki z lutego 2013 r. Podoba mi się pomysł mówienia o „czających się zmiennych”. Również ta kreskówka jest uroczym początkiem rozmowy:
Identyfikujemy zmienną niezależną i zależną w kreskówce i mówimy o tym, czy jest to przykład związku przyczynowego, jeśli nie, dlaczego nie.
źródło
Przeczytałem (dawno temu) interesujący przykład spadku liczby urodzeń (lub współczynników dzietności, jeśli wolisz ten środek), szczególnie w Stanach Zjednoczonych, począwszy od wczesnych lat 60. XX wieku, ponieważ testy broni jądrowej były najwyższe w historii (w 1961 r. przetestowano największą bombę nuklearną, jaką kiedykolwiek zdetonowano) w ZSRR. Wskaźniki nadal kształtowały się aż do końca XX wieku, kiedy większość z nich w końcu przestała to robić.
Nie mogę teraz znaleźć odniesienia, które łączyłoby te liczby, ale w tym artykule w Wikipedii są dane liczbowe dotyczące numerów testów broni jądrowej według kraju.
Oczywiście lepiej byłoby spojrzeć na korelację wskaźnika urodzeń z wprowadzeniem i legalizacją pigułki antykoncepcyjnej „przypadkowo” od wczesnych lat sześćdziesiątych. (Najpierw tylko w niektórych stanach, potem we wszystkich stanach tylko dla zamężnych kobiet, potem w niektórych stanach niezamężnych, a następnie we wszystkich kierunkach), Ale nawet to może być tylko częścią przyczyny; wiele innych aspektów równości, zmian gospodarczych i innych czynników odgrywa znaczącą rolę.
źródło
Sama korelacja nigdy nie może ustanowić związku przyczynowego. David Hume (1771-1776) argumentował dość skutecznie, że nie możemy uzyskać pewnej wiedzy na temat przyczyny za pomocą środków czysto empirycznych. Kant próbował rozwiązać ten problem, strona Wikipedii dla Kanta wydaje się całkiem ładnie podsumować:
Innymi słowy, Hume mówi nam, że nigdy nie możemy wiedzieć, że związek przyczynowy istnieje tylko poprzez obserwację korelacji, ale Kant sugeruje, że możemy być w stanie użyć naszego rozumu do odróżnienia korelacji, które implikują związek przyczynowy od tych, którzy tego nie robią. Nie sądzę, by Hume się nie zgodził, dopóki Kant pisał w kategoriach wiarygodności, a nie pewnej wiedzy.
Krótko mówiąc, korelacja dostarcza dowodów poszlakowych sugerujących związek przyczynowy, ale waga dowodów zależy w dużej mierze od konkretnych okoliczności, o których mowa, i nigdy nie możemy być absolutnie pewni. Zdolność przewidywania skutków interwencji jest jednym ze sposobów na zdobycie pewności siebie (nie możemy niczego udowodnić, ale możemy obalić dowody obserwacyjne, więc przynajmniej próbowaliśmy sfałszować teorię związku przyczynowego). Posiadanie prostego modelu, który wyjaśnia, dlaczego powinniśmy obserwować korelację, która wyjaśnia również inne formy dowodów, jest innym sposobem na zastosowanie naszego rozumowania, jak sugeruje Kant.
Zastrzegający emptor: Jest całkiem możliwe, że źle zrozumiałem filozofię, jednak pozostaje faktem, że korelacja nigdy nie może dostarczyć dowodu związku przyczynowego.
źródło
źródło
Standardowe cytowanie wskazujące na korelację między liczbą noworodków a parami hodowlanymi bocianów w Niemczech Zachodnich to nowy parametr edukacji seksualnej , Nature 332, 495 (07 kwietnia 1988); doi: 10.1038 / 332495a0
źródło
Liczba plemników u samców w słoweńskich wioskach, a liczba niedźwiedzi (również w Słowenii) wykazuje ujemną korelację. Niektórzy uważają to za bardzo niepokojące. Spróbuję zdobyć badanie, które to zrobiło.
źródło
Niedawno byłem na konferencji, a jeden z prelegentów podał ten bardzo interesujący przykład (chociaż chodziło o zilustrowanie czegoś innego):
Amerykanie i Anglicy jedzą dużo tłustego jedzenia. W Stanach Zjednoczonych i Wielkiej Brytanii występuje wysoki odsetek chorób sercowo-naczyniowych.
Francuzi jedzą dużo tłustych potraw, ale mają niższy wskaźnik chorób sercowo-naczyniowych.
Amerykanie i Anglicy piją dużo alkoholu. W Stanach Zjednoczonych i Wielkiej Brytanii występuje wysoki odsetek chorób sercowo-naczyniowych.
Włosi piją dużo alkoholu, ale znowu mają niższy wskaźnik chorób sercowo-naczyniowych.
Konkluzja? Jedz i pij, co chcesz. A jeśli mówisz po angielsku, masz większe szanse na atak serca!
źródło
Ta kreskówka rom XKCD jest również opublikowana w innym miejscu na CrossValidated.
źródło
Innym przykładem stosowanej przeze mnie korelacji jest duży wzrost liczby osób jedzących żywność organiczną oraz wzrost liczby dzieci ze zdiagnozowanym autyzmem w USA. W sieci znajduje się wykres parodii -
źródło
http://tylervigen.com/
Pokazuje to mnóstwo korelacji, które oczywiście nie mają nic wspólnego z przyczynowością - czy masz jakiś dobry pomysł, jaki jest związek z korelacją Age of Miss America koreluje z morderstwami przez parę, gorące opary i gorące przedmioty
??
źródło
Nauczanie „Korelacja nie oznacza związku przyczynowego” tak naprawdę nikomu nie pomaga, ponieważ na koniec dnia wszystkie argumenty dedukcyjne są częściowo oparte na korelacji.
Ludzie bardzo źle uczą się nie robić czegoś.
Cel powinien być raczej konstruktywny: zawsze myśl o alternatywach dla początkowych założeń, które mogą dawać te same dane.
źródło
Mój profesor zastosował je w klasie prawdopodobieństwa wprowadzenia:
1) Rozmiar buta jest skorelowany ze zdolnością czytania
2) Atak rekinów jest skorelowany ze sprzedażą lodów.
źródło
Im więcej wozów strażackich wysłanych do ognia, tym większe szkody.
źródło
Myślę, że lepszym paradygmatem może być związek przyczynowy, który wymaga korelacji związanej z wiarygodnym i najlepiej sprawdzonym mechanizmem. Myślę, że słowo „sugeruj” powinno być używane bardzo oszczędnie w tym kontekście, ponieważ ma kilka znaczeń, w tym sugestię.
źródło
Przykład bocianów znajduje się na stronie 8 pierwszego wydania (1978) książki Box, Hunter & Hunter zatytułowanej „Statistics for Experimenters ...” (Wiley). Nie wiem, czy jest w 2. edycji. Określają miasto jako Oldenburg, a okres 1930–1936.
Odnoszą się do Ornithologische Monatsberichte , 44 , No 2, Jahrgang, 1936, Berlin, i 48 , No 1, Jahrgang, 1940, Berlin i Statistiches Jahrbuch Deutscher Gemeinden , 27-33, 1932-1938, Gustav Fischer, Jena.
źródło
W artykule widziałem zabawny.
Produkcja masła w Bangladeszu ma jedną z najwyższych korelacji z S&P 500 w ciągu dziesięciu lat.
źródło
Oto idealny. I, niestety, można go wykorzystać jako świetny punkt do nauki, ponieważ ani pracownicy Washington Post, ani Centra Kontroli i Zapobiegania Chorobom nie wykazują żadnej wiedzy o tym, że artykuł powinien być satyrycznym utworem w Cebuli.
https://www.washingtonpost.com/health/trumps-presidency-may-be-making-latinos-sick/2019/07/19/4e89b9f0-a97f-11e9-9214-246e594de5d5_story.html?utm_term=.9dd329c2e837
źródło
Ktoś powiedział, że korelacja może nie oznaczać związku przyczynowego, ale z pewnością może być dobrą wskazówką :)
Ok, pomijając zabawną część, czym dokładnie jest związek przyczynowy? Czy naprawdę jesteśmy pewni, że piraci nie powodują globalnego ocieplenia?
Przeciwnie intuicyjne, ale to, co jest uważane za przyczynę, a co za efekt (w badaniu korelacji nie jest tak jasne). Oczywiście wiele razy oba mogą być tylko skutkami wspólnej przyczyny (a więc skorelowane)
Wszystko sprowadza się do metody określania związku przyczynowego.
Jest to przyczyna (zamierzona gra słów):
Są małe kłamstwa. Są wielkie kłamstwa I statystyki.
źródło