Czy korelacja = 0,2 oznacza, że ​​istnieje związek „tylko u 1 na 5 osób”?

48

W książce The Idiot Brain: A Neuroscientist wyjaśnia, na czym polega twoja głowa , napisał Dean Burnett

Korelacja między wzrostem a inteligencją jest zwykle cytowana jako około , co oznacza, że ​​wzrost i inteligencja wydają się być powiązane tylko u na osób.0.215

Dla mnie brzmi to źle: rozumiem korelację bardziej jak błąd (brak), który otrzymujemy, gdy próbujemy przewidzieć jedną miarę (tutaj inteligencję), jeśli jedyną rzeczą, jaką wiemy o tej osobie, jest druga miara (tutaj wysokość). Jeśli korelacja wynosi lub , to nie popełniamy żadnego błędu w naszej prognozie, jeśli korelacja wynosi , wtedy jest więcej błędów. Tak więc korelacja dotyczyłaby każdego, nie tylko na osób.110.815

Patrzyłem na to pytanie, ale nie jestem wystarczająco dobry z matematyki, aby zrozumieć odpowiedź. Ta odpowiedź, która mówi o sile relacji liniowej, wydaje się zgodna z moim rozumieniem, ale nie jestem pewien.

Sitak
źródło
6
@JamesPhillips, masz na myśli , a nie sam . Jeśli to więc 4%. r2rr 2 = 0,04r=0.2r2=0.04
Richard Hardy
4
4 procent ma sens bardziej niż 20 procent, dziękuję uprzejmie za korektę, zgadzam się z tobą.
James Phillips
29
Ta 0,01% próbka książki sprawia, że ​​zastanawiam się, jakie bzdury można znaleźć w pozostałych ...
Nick Cox
11
Faworyzowałem ten post, ponieważ jest to rodzaj niezwykle prostego pytania, które na pytanie studenta statystycznego 001 (lub innego neofity lub kandydata do pracy) natychmiast i jednoznacznie określi, czy rozumie, co oznacza korelacja.
whuber
4
Chciałbym przestać czytać tę książkę, prawo o teraz
doktorat

Odpowiedzi:

69

Cytowany fragment jest rzeczywiście niepoprawny. Współczynnik korelacji określa stopień powiązania w całej populacji (lub próbce, w przypadku współczynnika korelacji w próbce). Nie dzieli populacji na części, z których jedna pokazuje związek, a druga nie. To mógł być przypadek, że populacja składa się właściwie z dwóch subpopulacji o różnym stopniu stowarzyszenia, ale sam współczynnik korelacji nie implikuje tego.

Kodiolog
źródło
19
Co więcej, nawet w populacji, w której 20% osób wykazało doskonałą korelację między wzrostem a inteligencją, a 80% wykazało korelację zerową, korelacja dla całej populacji niekoniecznie wynosi 0,2. Oświadczenie jest błędne na kilka sposobów!
Nuclear Wang
Dziwne rzeczy dzieją się z wątkami, które trafiają na listę Hot Network. Ta odpowiedź jest oczywiście poprawna i w porządku ... ale 57 głosów pozytywnych ?! :-)
ameba mówi Przywróć Monikę
2
@amoeba Jeśli uważasz, że to dzikie, sprawdź moją odpowiedź o najwyższym wyniku .
Kodiolog,
Haha, jesteś mistrzem!
ameba mówi Przywróć Monikę
Czy liczy się to jako trollowanie, aby dać +1 coś tylko po to, aby zwiększyć dziwność, jaką jest SE?
Nat
18

Nie, 0,2 nie oznacza, że ​​1 na 5 osób wykazuje korelację. Nie wiem, jak mógłby napisać te bzdury.

Oto źródło liczby 0,2: „O źródłach korelacji wysokości i inteligencji: Nowe spostrzeżenia z dwuwymiarowego modelu ACE z łączeniem skojarzonym”, https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3044837/ Najwyraźniej korelacja jest solidna.

Już o tym wiedziałem: moje IQ znacznie wzrosło wraz z moim wzrostem, gdy dorastałem. Teraz wiem, dlaczego nie jestem już mądrzejszy: mój wzrost jest stabilny.

To był oczywiście żart, ale wskazuje na problem z argumentem autora tej książki „Idiota”: nikt nie mierzy w zależności tematycznej wysokości i ilorazu inteligencji, przynajmniej o ile mi wiadomo. Nie jestem pewien, jak zrobiłbyś to czysto, byłoby tyle zamieszania.

Powiedziawszy, że naukowcy stosują sztuczki, takie jak przyglądanie się bliźniakom oraz w rodzinnych korelacjach wysokości i ilorazu inteligencji, pomaga im to rozwiązać skomplikowane problemy. Przypuszczalnie bliźniaki dorastają w podobnym środowisku i mają to samo DNA, więc w badaniach obserwacyjnych pomaga rozwiązać endogeniczność i inne problemy. Jeśli jednak odłożysz to na bok, sedno jest takie, że „korelacja 0,2” nie daje podstaw do powiedzenia bzdur, jak u niektórych osób istnieje korelacja, a u innych nie. To tylko absurdalna interpretacja wyników badań korelacji.

Aksakal
źródło
8
-1: choć rozumiem ducha ostatniego akapitu tej odpowiedzi, uważam, że zwiększa to zamieszanie, ponieważ niepotrzebnie wprowadza pojęcie przyczynowości ( whytutaj nie ma znaczenia).
Jorge Leitao,
1
Musisz być tym na pięciu, dla którego istnieje korelacja.
Carsten S
@ JorgeLeitão Oczywiście, że nie, nie sugeruje się żadnego związku przyczynowego, dorastali razem, to korelacja! :)
Firebug
@ JorgeLeitão, jeśli cokolwiek badania NN wykazują, że rozmiar ma znaczenie. Zarówno większy mózg, jak i większa próbka. Kiedy dorastamy, nasze mózgi rosną i przepuszczamy przez nie więcej rzeczy, dlatego powinniśmy stać się mądrzejsi. Ponadto mężczyźni są średnio wyżsi niż kobiety, więc muszą być również mądrzejsi.
Aksakal
Hah, co za bzdury.
Lekkość ściga się z Moniką
8

Ironia zawarta w oświadczeniu jest prawie zbyt gruba, aby ją przeanalizować. Biorąc pod uwagę tytuł tekstu, zakładam, że zamierzony był pewien język w policzek. Jednak twoje „przeczucie”, mówiąc, że to źle, jest prawdopodobnie na dobrej drodze, jeśli intuicja na coś się liczy. Niestety, wiele raportów naukowych wymyka się intuicji, gdy mamy do czynienia z pojęciami, których nie napotkaliśmy.

Możliwe jest , że mierząc związek między i , korelacja między i wynosi 1,0 u 20% populacji i 0 u pozostałych 80%. Efektem netto jest to, że ogólna korelacja i wynosi 0,2. Cały czas widzimy to w farmakoepidemiologii: lek eksperymentalny jest uważany za „skuteczny”, jeśli średnio przynosi pozytywne korzyści; wiele leków będących w powszechnym obrocie, z których niektóre możesz przyjmować, mogą zaszkodzić ci z powodu interakcji z twoim zachowaniem lub genetyką, ale tak naprawdę nikt tego nie wie.Y X Y X YXYXYXY

Powyższe jest tylko jedną z możliwych interpretacji korelacji 0,2; jest bardzo daleko idąca, ponieważ tak niewiele rzeczy w życiu ma korelację 1 lub 0, a mniej rzeczy wciąż ma modyfikację efektu wystarczająco silną, aby wytworzyć tak rozbieżne korelacje.

AdamO
źródło
1
„Możliwe jest, że mierząc związek między X i Y, korelacja między X i Y wynosi 1,0 na 20% populacji i 0 na pozostałych 80%.” - w opublikowanym przeze mnie badaniu przyjrzeli się rodzinie i korelacje między bliźniakami różnią się od ogólnej populacji. Jestem jednak pewien, że nie to miał na myśli autor książki, ale to, jak interpretuje, na czym polega korelacja
Aksakal
@Aksakal co ciekawe, te metody wariancji składowych mają na celu oszacowanie tej samej korelacji poziomu populacji, jaka byłaby mierzona w populacji, po prostu twierdzą, że używają odziedziczalności do „golenia” wariancji fenotypowej związanej z obecnym wpływem na środowisko (komponent E ACE model): ważne źródło mylenia w rozważanej hipotezie.
AdamO,
10
Jeśli korelacja wynosi 1 na 20% populacji i 0 na 80%, to nie wynika z tego, że ogólnie wynosi 0,2. Zależy od względnej wariancji w każdej subpopulacji.
ameba mówi Przywróć Monikę
1
@amoeba tak, dobra uwaga, dalej podkreśla, co idiopatyczny scenariusz uzasadniałby takie twierdzenie.
AdamO,
4
„Zakładam, że zamierzony był jakiś język w policzek”. Jesteś bardziej charytatywny niż ja. To jest po prostu złe. Nie widzę powodu, by sądzić, że autor celowo się mylił w sposób, który miał być sprytny. Najbardziej charytatywna interpretacja polega na tym, że autor chciał podkreślić probabilistyczną naturę korelacji i bezmyślnie wybrał zły sposób jej zilustrowania, a sposób, w jaki sam autor prawdopodobnie by się zgodził, nie miałby sensu, gdyby mu to wskazano.
John Coleman
2

Trudno byłoby wymyślić sensowną, a tym bardziej poprawną interpretację. Skojarzenie nie jest własnością pojedynczych punktów danych. Gdybyś miał tylko wzrost i inteligencję jednej osoby, jak możesz powiedzieć, czy wzrost i inteligencja są ze sobą powiązane? Przypuszczam, że gdybyśmy mieli średnią wysokość i inteligencję, moglibyśmy powiedzieć, że każdy powyżej średniej w obu, lub poniżej średniej w obu, wykazuje „skojarzenie”. Ale jeśli masz całkowicie przypadkowe dane (bez korelacji), powinieneś oczekiwać, że połowa ludzi wykaże „skojarzenie” w tym sensie. Wygenerowałem losowy zestaw danych z korelacją wokół .2 (właściwie .22) i stwierdziłem, że 55 pokazuje „skojarzenie” w tym sensie.

Możliwe jest, że Y będzie rosnącą funkcją X, a korelacja między nimi wyniesie tylko .5; głupio byłoby powiedzieć, że tylko połowa ludzi wykazuje skojarzenie, jeśli każda osoba ma wyższą inteligencję niż każda niższa osoba i niższą inteligencję niż wszyscy wyżsi. Ponadto teoretycznie możliwe jest, aby jedna wartość odstająca tworzyła całą korelację, a korelacja zbioru bez tego punktu wynosiła zero. Możliwe jest nawet, że 20% populacji ma ujemną korelację, a pozostałe 80% ma również ujemną korelację, a całkowita korelacja wynosi .2.

Akumulacja
źródło