Na blogu znalazłem następujące wyjaśnienie i chciałbym uzyskać więcej informacji na temat nieprzechodniości korelacji:
Mamy następujące niepodważalne fakty:
- Przeciętnie istnieje różnica w objętości mózgu między mężczyznami i kobietami
- Istnieje korelacja między IQ a rozmiarem mózgu; korelacja wynosi 0,33, a zatem odpowiada 10% zmienności IQ
Z przesłanek 1 i 2 wynika logicznie, że: kobiety mają niższe IQ niż mężczyźni. Ale to błąd! W statystykach korelacje nie są przechodnie. Dowód jest taki, że wystarczy spojrzeć na wyniki testów IQ, które pokazują, że IQ mężczyzn i kobiet nie różnią się średnio.
Chciałbym nieco głębiej zrozumieć tę nieprzechodniość korelacji.
Gdyby korelacja między IQ a rozmiarem mózgu wynosiła 0,9 (co wiem, że nie jest (1)), czy wnioskowanie, że kobiety mają przeciętnie niższe IQ niż mężczyźni, byłoby nadal błędem?
Proszę, nie jestem tutaj, aby mówić o ilorazie inteligencji (i granicach testu), seksizmie, stereotypie kobiet, arogancji i tak dalej (2). Chcę tylko zrozumieć logiczne rozumowanie stojące za błędem.
(1) co wiem, że tak nie jest: neandertalczycy mieli większe mózgi niż homo sapiens, ale nie byli mądrzejsi;
(2) Jestem kobietą i ogólnie rzecz biorąc, nie uważam siebie ani innych kobiet za mniej inteligentnych od mężczyzn, nie dbam o test IQ, ponieważ liczy się wartość ludzi i nie jest ona oparta na zdolności intelektualne.
Oryginalne źródło w języku francuskim:
Na niezaprzeczalne powody:
- Różnica między cérébral a moyenne entre hommes et femmes
- korelacja między QI a cérébral; korelacja wynosi 0,33 i odpowiada 10% zmienności
De ces prémisses 1 i 2, semble découler logiquement que: les femmes ont en moyenne un QI inférieur aux hommes.
Mais c'est une erreur de raisonnement! W statystyce, korelacje ne sont pas przechodnie. La preuve, c'est que pour en unikir le cœur net, wystarczy sprawdzić wyniki testów QI, a ceux-ci montrent que les QI des hommes et des femmes ne diffèrent pas en moyenne.
Odpowiedzi:
Tak, nadal byłby to błąd.
Oto bardzo prosta liczba pokazująca cztery różne sytuacje. W każdym przypadku czerwone kropki oznaczają kobiety, niebieska kropka reprezentuje mężczyzn, oś pozioma reprezentuje rozmiar mózgu, a oś pionowa reprezentuje iloraz inteligencji. Wygenerowałem wszystkie cztery zestawy danych, które:
zawsze istnieje taka sama różnica w średniej wielkości mózgu między mężczyznami ( ) i kobietami ( 28 - jednostki są arbitralne). Są to średnie populacyjne, ale ta różnica jest wystarczająco duża, aby być statystycznie istotna przy każdej rozsądnej wielkości próby;22 28
zawsze występuje zerowa różnica w średnim IQ między mężczyznami i kobietami (po ), a także zerowa korelacja między płcią a IQ;100
siła korelacji między wielkością mózgu a ilorazem inteligencji zmienia się, jak pokazano na rysunku.
W lewym górnym wykresie korelacja między płciami (obliczana osobno dla mężczyzn i osobno dla kobiet, a następnie uśredniana) wynosi , jak w cytacie. W prawym górnym wykresie ogólna korelacja (łącznie mężczyzn i kobiet) wynosi 0,3 . Pamiętaj, że Twoja wycena nie określa, do czego odnosi się liczba 0,33 . W lewym dolnym wykresie korelacja między płciami wynosi 0,9 , podobnie jak w twoim hipotetycznym przykładzie; w prawym dolnym wykresie ogólna korelacja wynosi 0,9 .0.3 0.3 0.33 0.9 0.9
Możesz więc mieć dowolną wartość korelacji i nie ma znaczenia, czy jest obliczana ogólnie, czy w grupie. Niezależnie od współczynnika korelacji, bardzo możliwe jest, że istnieje zerowa korelacja między płcią a ilorazem inteligencji i zerowa różnica płci w średnim ilorazie inteligencji.
Badanie nieprzechodniości
Zbadajmy pełną przestrzeń możliwości, stosując podejście sugerowane przez @kjetil. Załóżmy, że masz trzy zmienne i (bez utraty ogólności) załóżmy, że korelacja między x 1 i x 2 wynosi a > 0, a korelacja między x 2 a x 3 wynosi b > 0 . Pytanie brzmi: jaka jest minimalna możliwa dodatnia wartość korelacji λ między x 1 a x 3x1,x2,x3 x1 x2 a>0 x2 x3 b>0 λ x1 x3 ? Czy czasem musi być dodatnia, czy zawsze może być zerowa?
Macierz korelacji wynosi i musi mieć nieujemną determinantę, tj. D e t R = - λ 2 + 2 a b λ - ( a 2 + b 2 - 1 ) ≥ 0 , co oznacza, że X ma leżeć między a , b ± √
Możemy rozwiązać to numerycznie i wykreślić minimalną możliwą dodatnią wartość dla różnych a i b :λ a b
Nieformalnie możemy powiedzieć, że korelacje byłyby przechodnie, gdyby przyjąć , że i b > 0 , można by wnioskować, że λ > 0 . Widzimy, że dla większości z wartości a i b , λ może wynosić zero, co oznacza, że korelacje są dla przechodnia. Jednak dla niektórych dostatecznie wysokich wartości a i b korelacja λ musi być dodatnia , co oznacza, że w końcu występuje „pewien stopień przechodniości”, ale ogranicza się tylko do bardzo wysokich korelacji. Zauważ, że obie korelacje a i ba>0 b>0 λ>0 a b λ a b λ a b muszą być wysokie.
Możemy wypracować precyzyjne warunki dla tej „przechodniości”: jak wspomniano powyżej, mniejsza korzeń powinien być dodatni, tzn b - √, co jest równoważnez2+b2>1. To jest równanie koła! I rzeczywiście, jeśli spojrzysz na powyższy rysunek, zauważysz, że niebieski region tworzy ćwierć koła.ab−(1−a2)(1−b2)−−−−−−−−−−−−−√>0 a2+b2>1
W twoim konkretnym przykładzie korelacja między płcią a rozmiarem mózgu jest dość umiarkowana (być może ), a korelacja między rozmiarem mózgu a ilorazem inteligencji wynosi b = 0,33 , co mocno mieści się w niebieskim obszarze ( a 2 + b 2 < 1 ), co oznacza, że λ może być dodatnie, ujemne lub zero.a=0.5 b=0.33 a2+b2<1 λ
Odpowiednia postać z pierwotnego opracowania
Chciałeś uniknąć dyskusji o płci i umyśle, ale nie mogę nie wspomnieć o tym, że patrząc na pełną liczbę z oryginalnego artykułu ( Gur i in. 1999 ), widać, że chociaż nie ma różnicy między płciami w werbalnym wyniku IQ, istnieje oczywista i znacząca różnica w przestrzennym wyniku IQ! Porównaj podploty D i F.
źródło
Aktualizacja:
źródło
Jest to sytuacja, w której lubię używać diagramów ścieżek do zilustrowania efektów bezpośrednich i pośrednich oraz tego, w jaki sposób wpływają one na ogólne korelacje.
Według oryginalnego opisu poniżej mamy macierz korelacji. Rozmiar mózgu ma około 0,3 korelacji z IQ, kobiety i IQ mają ze sobą korelację 0. Uzupełniam ujemną korelację między wielkością kobiety a mózgiem, aby wynosić -0,3 (gdybym musiał zgadywać, że jest ona znacznie mniejsza niż ta, ale posłuży to do celów ilustracyjnych).
Jeśli dopasujemy model regresji, w którym iloraz inteligencji jest funkcją wielkości mózgu, a będąc kobietą, możemy to zilustrować za pomocą diagramu ścieżki. Podałem współczynniki częściowej regresji na strzałkach, a węzeł B oznacza rozmiar mózgu, a węzeł F oznacza kobietę.
Jak szalone jest to - kontrolując rozmiar mózgu, biorąc pod uwagę te korelacje, kobiety mają pozytywny związek z IQ. Dlaczego tak jest, skoro marginalna korelacja wynosi zero? Zgodnie z regułami z liniowymi diagramami ścieżek ( Wright, 1934 ), możemy dekomponować korelację brzeżną jako funkcję efektu bezpośredniego przy kontrolowaniu wielkości mózgu i efektu pośredniego:
Ponieważ całkowity efekt wynosi zero, wiemy, że efekt bezpośredni musi być po prostu dokładnie odwrotnym znakiem i rozmiarem efektu pośredniego , stąd efekt bezpośredni w tym przykładzie wynosi 0,099. Otóż, tutaj mamy sytuację, gdy oceniamy oczekiwane IQ samic, otrzymujemy dwie różne odpowiedzi, choć prawdopodobnie nie to, czego początkowo oczekiwałeś, określając pytanie. Po prostu oceniając krańcowe oczekiwane IQ kobiet w porównaniu z mężczyznami, różnica wynosi zero, jak ją zdefiniowałeś (mając zerową korelację). Oceniając oczekiwaną różnicę zależną od wielkości mózgu, kobiety mają wyższe IQ niż mężczyźni.
Możesz wstawić do tego przykładu albo większe korelacje między rozmiarem mózgu a ilorazem inteligencji (lub mniejsze korelacje między rozmiarem kobiety a rozmiarem mózgu), biorąc pod uwagę ograniczenia, które pokazuje kjetil w swojej odpowiedzi. Zwiększenie tego pierwszego powoduje, że różnica między warunkowym ilorazem inteligencji kobiet i mężczyzn jest jeszcze większa na korzyść kobiet, zmniejszenie drugiego powoduje zmniejszenie różnic.
źródło
Zauważ, że chociaż cytowany tekst mówi ogólnie o „korelacji między objętością mózgu a ilorazem inteligencji”, dostarczony obraz rozróżnia dwie linie trendu (tj. Pokazuje korelację dla dwóch podgrup osobno). Rozważamy je więc osobno (co jest właściwą drogą).
Następnie
i
Więc tak musi być
i to
źródło