Brak przechodniości korelacji: korelacje między płcią a rozmiarem mózgu oraz między wielkością mózgu a ilorazem inteligencji, ale brak korelacji między płcią a ilorazem inteligencji

18

Na blogu znalazłem następujące wyjaśnienie i chciałbym uzyskać więcej informacji na temat nieprzechodniości korelacji:

Mamy następujące niepodważalne fakty:

  • Przeciętnie istnieje różnica w objętości mózgu między mężczyznami i kobietami
  • Istnieje korelacja między IQ a rozmiarem mózgu; korelacja wynosi 0,33, a zatem odpowiada 10% zmienności IQ

Z przesłanek 1 i 2 wynika logicznie, że: kobiety mają niższe IQ niż mężczyźni. Ale to błąd! W statystykach korelacje nie są przechodnie. Dowód jest taki, że wystarczy spojrzeć na wyniki testów IQ, które pokazują, że IQ mężczyzn i kobiet nie różnią się średnio.

Chciałbym nieco głębiej zrozumieć tę nieprzechodniość korelacji.

Gdyby korelacja między IQ a rozmiarem mózgu wynosiła 0,9 (co wiem, że nie jest (1)), czy wnioskowanie, że kobiety mają przeciętnie niższe IQ niż mężczyźni, byłoby nadal błędem?

Proszę, nie jestem tutaj, aby mówić o ilorazie inteligencji (i granicach testu), seksizmie, stereotypie kobiet, arogancji i tak dalej (2). Chcę tylko zrozumieć logiczne rozumowanie stojące za błędem.


(1) co wiem, że tak nie jest: neandertalczycy mieli większe mózgi niż homo sapiens, ale nie byli mądrzejsi;

(2) Jestem kobietą i ogólnie rzecz biorąc, nie uważam siebie ani innych kobiet za mniej inteligentnych od mężczyzn, nie dbam o test IQ, ponieważ liczy się wartość ludzi i nie jest ona oparta na zdolności intelektualne.


Oryginalne źródło w języku francuskim:

Na niezaprzeczalne powody:

  • Różnica między cérébral a moyenne entre hommes et femmes
  • korelacja między QI a cérébral; korelacja wynosi 0,33 i odpowiada 10% zmienności

De ces prémisses 1 i 2, semble découler logiquement que: les femmes ont en moyenne un QI inférieur aux hommes.

Mais c'est une erreur de raisonnement! W statystyce, korelacje ne sont pas przechodnie. La preuve, c'est que pour en unikir le cœur net, wystarczy sprawdzić wyniki testów QI, a ceux-ci montrent que les QI des hommes et des femmes ne diffèrent pas en moyenne.

wprowadź opis zdjęcia tutaj

MagTun
źródło
5
Nie rozumiem, w jaki sposób te stwierdzenia mają w ogóle związek z korelacją (a odniesienie do „przechodniości” wydaje się w tym kontekście całkowicie niewłaściwe). W końcu wniosek ma związek ze średnią różnicą. Ta statystyka (która jest pierwszym momentem) jest całkowicie niezależna od korelacji (która pochodzi z drugich chwil). Nawet jeśli korelacja jest idealna nie można wyciągać żadnych wniosków na temat różnicy średnich drugiej zmiennej na podstawie różnicy średnich pierwszej zmiennej. ±1
whuber
5
Można pokazać (Langford, Schwertman i Owens (2001)), że dodatnia korelacja jest przechodnia, jeśli suma kwadratów korelacji jest większa niż 1: ρXY2)+ρYX2)>1ρXZ>0
CloseToC
2
@whuber: Tak, ale to nie jest pytanie o związek między środkami X i Y (wielkość mózgu i IQ), chodzi o związek między środkami Y w dwóch różnych grupach ... Myślę, że to oczywiste że jeśli korelacja między wielkością mózgu a IQ jest idealna (tj. IQ jest liniową funkcją wielkości mózgu) i jeśli średnia wielkość mózgu różni się między mężczyznami i kobietami, to średnie IQ różni się między mężczyznami i kobietami.
ameba mówi Przywróć Monikę
2
@Amoeba Dziękuję za tę interpretację. Cytat zaczyna mieć sens (wreszcie!). Jednak określanie tego mianem „przechodniości korelacji” jest tak niejasne, że może być szczerze mylące. (To wyrażenie występuje w oryginalnym języku francuskim, więc nie możemy nawet winić tłumaczenia.)
whuber
3
@amoeba To prawdopodobne. Ale myślę, że musisz trochę rozciągnąć, aby tam dotrzeć! Cytat nie charakteryzuje związku między płcią a rozmiarem mózgu jako „korelacja” - jedynie jako różnica średnich między dwiema grupami ( nawiasem mówiąc, nie jest to standardowa miara korelacji). Myślę jednak, że powinniśmy rozumieć „korelację” w szerokim znaczeniu jako „brak zależności” lub coś w tym rodzaju.
whuber

Odpowiedzi:

16

Tak, nadal byłby to błąd.

Oto bardzo prosta liczba pokazująca cztery różne sytuacje. W każdym przypadku czerwone kropki oznaczają kobiety, niebieska kropka reprezentuje mężczyzn, oś pozioma reprezentuje rozmiar mózgu, a oś pionowa reprezentuje iloraz inteligencji. Wygenerowałem wszystkie cztery zestawy danych, które:

  • zawsze istnieje taka sama różnica w średniej wielkości mózgu między mężczyznami ( ) i kobietami ( 28 - jednostki są arbitralne). Są to średnie populacyjne, ale ta różnica jest wystarczająco duża, aby być statystycznie istotna przy każdej rozsądnej wielkości próby;2228

  • zawsze występuje zerowa różnica w średnim IQ między mężczyznami i kobietami (po ), a także zerowa korelacja między płcią a IQ;100

  • siła korelacji między wielkością mózgu a ilorazem inteligencji zmienia się, jak pokazano na rysunku.

korelacje

W lewym górnym wykresie korelacja między płciami (obliczana osobno dla mężczyzn i osobno dla kobiet, a następnie uśredniana) wynosi , jak w cytacie. W prawym górnym wykresie ogólna korelacja (łącznie mężczyzn i kobiet) wynosi 0,3 . Pamiętaj, że Twoja wycena nie określa, do czego odnosi się liczba 0,33 . W lewym dolnym wykresie korelacja między płciami wynosi 0,9 , podobnie jak w twoim hipotetycznym przykładzie; w prawym dolnym wykresie ogólna korelacja wynosi 0,9 .0.30.30.330.90.9

Możesz więc mieć dowolną wartość korelacji i nie ma znaczenia, czy jest obliczana ogólnie, czy w grupie. Niezależnie od współczynnika korelacji, bardzo możliwe jest, że istnieje zerowa korelacja między płcią a ilorazem inteligencji i zerowa różnica płci w średnim ilorazie inteligencji.


Badanie nieprzechodniości

Zbadajmy pełną przestrzeń możliwości, stosując podejście sugerowane przez @kjetil. Załóżmy, że masz trzy zmienne i (bez utraty ogólności) załóżmy, że korelacja między x 1 i x 2 wynosi a > 0, a korelacja między x 2 a x 3 wynosi b > 0 . Pytanie brzmi: jaka jest minimalna możliwa dodatnia wartość korelacji λ między x 1 a x 3x1,x2,x3x1x2a>0x2x3b>0λx1x3? Czy czasem musi być dodatnia, czy zawsze może być zerowa?

Macierz korelacji wynosi i musi mieć nieujemną determinantę, tj. D e t R = - λ 2 + 2 a b λ - ( a 2 + b 2 - 1 ) 0 , co oznacza, że X ma leżeć między a , b ±

R=(1aλa1bλb1)
detR=λ2+2abλ(a2+b21)0,
λJeśli oba pierwiastki są dodatnie, to minimalna możliwa wartośćλjest równa mniejszemu pierwiastkowi (aλmusi być dodatnie!). Jeśli zero jest między tymi dwoma pierwiastkami, wtedyλmoże wynosić zero.
ab±(1a2)(1b2).
λλλ

Możemy rozwiązać to numerycznie i wykreślić minimalną możliwą dodatnią wartość dla różnych a i b :λab

Badanie nieprzechodniości

Nieformalnie możemy powiedzieć, że korelacje byłyby przechodnie, gdyby przyjąć , że i b > 0 , można by wnioskować, że λ > 0 . Widzimy, że dla większości z wartości a i b , λ może wynosić zero, co oznacza, że korelacje są dla przechodnia. Jednak dla niektórych dostatecznie wysokich wartości a i b korelacja λ musi być dodatnia , co oznacza, że ​​w końcu występuje „pewien stopień przechodniości”, ale ogranicza się tylko do bardzo wysokich korelacji. Zauważ, że obie korelacje a i ba>0b>0λ>0abλabλ ab muszą być wysokie.

Możemy wypracować precyzyjne warunki dla tej „przechodniości”: jak wspomniano powyżej, mniejsza korzeń powinien być dodatni, tzn b - , co jest równoważnez2+b2>1. To jest równanie koła! I rzeczywiście, jeśli spojrzysz na powyższy rysunek, zauważysz, że niebieski region tworzy ćwierć koła.ab(1a2)(1b2)>0a2+b2>1

W twoim konkretnym przykładzie korelacja między płcią a rozmiarem mózgu jest dość umiarkowana (być może ), a korelacja między rozmiarem mózgu a ilorazem inteligencji wynosi b = 0,33 , co mocno mieści się w niebieskim obszarze ( a 2 + b 2 < 1 ), co oznacza, że λ może być dodatnie, ujemne lub zero.a=0.5b=0.33a2+b2<1λ


Odpowiednia postać z pierwotnego opracowania

Chciałeś uniknąć dyskusji o płci i umyśle, ale nie mogę nie wspomnieć o tym, że patrząc na pełną liczbę z oryginalnego artykułu ( Gur i in. 1999 ), widać, że chociaż nie ma różnicy między płciami w werbalnym wyniku IQ, istnieje oczywista i znacząca różnica w przestrzennym wyniku IQ! Porównaj podploty D i F.

Gur i in.

ameba mówi Przywróć Monikę
źródło
2
Uwielbiam te działki, które wygenerowałeś. Te z gazety, nie tyle ...
Shadowtalker
1
@AleksandrBlekh: Prawdę mówiąc, nie jestem pewien. "Mapa ciepła"? „Wykres konturowy”, ale kolorowy i bez konturów?
ameba mówi Przywróć Monikę
2
|λ|λ
1
xyyzxzab0λ0
1
Dzięki amebie za tę długą i szczegółową odpowiedź (a nawet dodaną tak dodatkową, bardzo mile widzianą przy okazji)! Sprawia, że ​​wszystko staje się jasne! Koncepcja jest tak trudna do uchwycenia dla mojego statystycznie niedoświadczonego mózgu, a ty zacieniałeś światło na problem! Dziękuję bardzo za czas poświęcony na opublikowanie odpowiedzi!
MagTun
8

x1=IQ,x2=genderx3

cor(x1,x2))=λ,cor(x1,x3))=cor(x2),x3))=ρ=0,9
λ
R=(1λρλ1ρρρ1)
ρ
detR=1(1-ρ2))-λ(λ-ρ2))+ρ(λρ-ρ)=1-λ2)-2)ρ2)+2)λρ2)0,
ρ2)λ+12)ρ=0,9λ0,62

Aktualizacja:

p=0,5μ1=mi(x1|x2)=1)μ0=E(x1|x2=0)μ=E(x1)μ=0=μ1+μ0μ0=μ1x1N(μ=0,σ2)x2p=1/2

corr(x1,x2)=E(x1μ)E(x2p)σ12=Δ2σ
Δ=μ1μ0=2μ1σ=10Δ/20informacje o średniej różnicy IQ są błędne! Byłoby to prawdą, gdyby płeć była zmienną ciągłą, co oczywiście nie jest. Zauważ, że fakt ten jest związany z faktem, że dla rozkładu dwumianowego wariancja jest funkcją średniej (jak to musi być, ponieważ istnieje tylko jeden wolny parametr do zmiany). To, co zrobiliśmy powyżej, naprawdę rozszerza to na kowariancję / korelację.

ρ=0.33λ0.7822λ=0

kjetil b halvorsen
źródło
1
cor(x1,x2)0.62E(x1)E(x2)
5
+1 - Uważam jednak, że koncepcja korelacji między ilorazem inteligencji mężczyzn i kobiet jest nieco myląca, ponieważ nigdy nie można obliczyć takiej wartości.
Andy W
1
Jaka powinna być korelacja między IQ mężczyzn i kobiet ?!
ameba mówi Przywróć Monikę
tak, zgadza się @amoeba! Być może nie użyłem poprawnych słów, aby wyrazić moje zamieszanie (jest to trudne, ponieważ nie jestem przyzwyczajony do statystyki), ale zmiennymi są rzeczywiście płeć, iloraz inteligencji i wielkość mózgu.
MagTun,
7

Jest to sytuacja, w której lubię używać diagramów ścieżek do zilustrowania efektów bezpośrednich i pośrednich oraz tego, w jaki sposób wpływają one na ogólne korelacje.

Według oryginalnego opisu poniżej mamy macierz korelacji. Rozmiar mózgu ma około 0,3 korelacji z IQ, kobiety i IQ mają ze sobą korelację 0. Uzupełniam ujemną korelację między wielkością kobiety a mózgiem, aby wynosić -0,3 (gdybym musiał zgadywać, że jest ona znacznie mniejsza niż ta, ale posłuży to do celów ilustracyjnych).

       Brain  Female  IQ
 Brain   1
Female  -0.3    1
    IQ   0.3    0      1

Jeśli dopasujemy model regresji, w którym iloraz inteligencji jest funkcją wielkości mózgu, a będąc kobietą, możemy to zilustrować za pomocą diagramu ścieżki. Podałem współczynniki częściowej regresji na strzałkach, a węzeł B oznacza rozmiar mózgu, a węzeł F oznacza kobietę.

wprowadź opis zdjęcia tutaj

Jak szalone jest to - kontrolując rozmiar mózgu, biorąc pod uwagę te korelacje, kobiety mają pozytywny związek z IQ. Dlaczego tak jest, skoro marginalna korelacja wynosi zero? Zgodnie z regułami z liniowymi diagramami ścieżek ( Wright, 1934 ), możemy dekomponować korelację brzeżną jako funkcję efektu bezpośredniego przy kontrolowaniu wielkości mózgu i efektu pośredniego:

TotalF,IQ=DirectF,IQ+IndirectF,B,IQ

TotalF,IQ=Cor(F,IQ)

IndirectF,B,IQ=Cor(F,B)Cor(B,IQ|F)0.099=0.30.33

Ponieważ całkowity efekt wynosi zero, wiemy, że efekt bezpośredni musi być po prostu dokładnie odwrotnym znakiem i rozmiarem efektu pośredniego , stąd efekt bezpośredni w tym przykładzie wynosi 0,099. Otóż, tutaj mamy sytuację, gdy oceniamy oczekiwane IQ samic, otrzymujemy dwie różne odpowiedzi, choć prawdopodobnie nie to, czego początkowo oczekiwałeś, określając pytanie. Po prostu oceniając krańcowe oczekiwane IQ kobiet w porównaniu z mężczyznami, różnica wynosi zero, jak ją zdefiniowałeś (mając zerową korelację). Oceniając oczekiwaną różnicę zależną od wielkości mózgu, kobiety mają wyższe IQ niż mężczyźni.

Możesz wstawić do tego przykładu albo większe korelacje między rozmiarem mózgu a ilorazem inteligencji (lub mniejsze korelacje między rozmiarem kobiety a rozmiarem mózgu), biorąc pod uwagę ograniczenia, które pokazuje kjetil w swojej odpowiedzi. Zwiększenie tego pierwszego powoduje, że różnica między warunkowym ilorazem inteligencji kobiet i mężczyzn jest jeszcze większa na korzyść kobiet, zmniejszenie drugiego powoduje zmniejszenie różnic.

Andy W.
źródło
Jeśli spojrzysz na dostarczone zdjęcie, pokazuje ono pozytywną (i silniejszą niż męska) korelację objętości mózgu kobiet z ilorazem inteligencji.
Alecos Papadopoulos
1
@Andy W Całkowicie wstydzę się zadać to głupie pytanie, ale jakiego oprogramowania użyłeś do narysowania wykresu węzłów?
mugen
1
To była szybka praca w inkscape @mugen. Poświęcając więcej czasu, myślę, że te, które robię za pomocą Lateksu i Tikza, są ładniejsze.
Andy W
+1 Czy możesz wskazać mi teorię stojącą za twoją drugą formułą?
Aleksandr Blekh
2
@AleksandrBlekh - cytowany przeze mnie artykuł Wright jest przełomowym źródłem. Judea Pearl bardziej obszernie komentuje swoją książkę Causality , chociaż istnieją prostsze sposoby leczenia. (W przypadku modeli liniowych dekompozycje są często pobieżnie traktowane w książkach do modelowania równań strukturalnych.)
Andy W
3

vq12)

(1)mi(v1)>mi(v2))=βmi(v1),0<β<1,ρ(v1,q1)>0,ρ(v2),q2))>0

Zauważ, że chociaż cytowany tekst mówi ogólnie o „korelacji między objętością mózgu a ilorazem inteligencji”, dostarczony obraz rozróżnia dwie linie trendu (tj. Pokazuje korelację dla dwóch podgrup osobno). Rozważamy je więc osobno (co jest właściwą drogą).

Następnie

ρ(v1,q1)>0doov(v1,q1)>0mi(v1q1)>mi(v1)mi(q1)

(2)mi(v1q1)mi(q1)>mi(v1)

i

ρ(v2),q2))>0doov(v2),q2))>0mi(v2)q2))>mi(v2))mi(q2))

(3)mi(v2)q2))βmi(q2))>mi(v1)

mi(q1)>mi(q2))

(4)mi(q1)=mi(q2))=q¯

Więc tak musi być

(5)(2)),(4)mi(v1q1)q¯>mi(v1)

i to

(6)(3)),(4)mi(v2)q2))βq¯>mi(v1)

(5)(6)
(1)

(1)E(q1)E(q2)(1)

Alecos Papadopoulos
źródło
2
Pomimo wszystkich przedstawionych tutaj obliczeń nadal nie widzę, w jaki sposób korelacja w ogóle ujawnia cokolwiek (lub narzuca jakiekolwiek ograniczenia) dotyczące związków między wartościami średnimi .
whuber
@whuber Cała odpowiedź polega na pokazaniu, że tak nie jest. Ostatnie zdania mówią dokładnie to. Dodajmy jeszcze jeden do tego efektu.
Alecos Papadopoulos
Ale jest to absolutnie podstawowe: nie potrzeba całej strony równań, aby to pokazać! Wystarczy zauważyć, że współczynniki korelacji są niezmienne dla lokalizacji, QED . Czy źle interpretuję pytanie?
whuber
1
@whuber Z całym szacunkiem i bez obrazy dla nikogo, ale obawiam się, że „źle interpretujesz” poziom wiedzy PO. W przeciwnym razie pytanie nie zostałoby opublikowane.
Alecos Papadopoulos
4
Zachęcam zatem do refleksji nad tym, czy i jak każda odpowiedź, która w dużym stopniu opiera się na równaniach matematycznych, jest odpowiednia do adresowania plakatów, które wydają się prosić o elementarne przedstawienie podstawowych pojęć. Jest to subtelna kwestia, ponieważ czasami jest to właściwe podejście. Co więcej, stopień, w jakim używa się matematyki - i sposób, w jaki wykłada się matematyczne idee - może być kwestią gustu. Ale IMHO tego rodzaju odpowiedź jest skuteczna tylko wtedy, gdy matematyka jest jasna i konsekwentnie koncentruje się na istotnym pomyśle.
whuber