Proste przykłady nieskorelowanych, ale nie niezależnych i

26

Każdy pracowity uczeń jest kontrprzykładem dla „wszyscy uczniowie są leniwi”.

Jakie są proste kontrprzykłady na „jeśli zmienne losowe i są nieskorelowane, to są one niezależne”?XY

Clare Brown
źródło
8
Myślę, że to duplikat, ale jestem zbyt leniwy, by go szukać. Weź i . , ale wyraźnie dwie zmienne nie są niezależne. Y = X 2 c o v ( X , Y ) = E X 3 = 0XN.(0,1)Y=X2)dooprzeciwko(X,Y)=miX3)=0
mpiktas
1
prosty przykład (choć być może są nawet prostsze)
Glen_b
1
Wziąć być równomiernie rozmieszczone na , a , . [ 0 , 2 π ] X = cos U Y = sin UU[0,2)π]X=sałataUY=grzechU
Dilip Sarwate
Ponieważ poczucie „najprostszego” jest niezdefiniowane, na to pytanie nie można obiektywnie odpowiedzieć. Wybrałem duplikat na stronie stats.stackexchange.com/questions/41317 na podstawie najprostszej = najmniejszej sumy liczebności podpór rozkładów krańcowych.
whuber
3
@whuber: Nawet „najprostsza” jest rzeczywiście niezbyt dobrze zdefiniowane, tutaj odpowiedzi, np odpowiedź przez Glen_b są wyraźnie zapewniając znacznie więcej niż prosty przykład wątku zamknięciu ten jeden jako duplikat. Sugeruję, aby ponownie otworzyć ten (już głosowałem) i być może sprawię, że CW podkreśli fakt, że „najprostszy” jest źle zdefiniowany, a OP może poprosić o różne „proste” przykłady.
ameba mówi Przywróć Monikę

Odpowiedzi:

18

Niech .XU(-1,1)

Niech .Y=X2)

Zmienne są nieskorelowane, ale zależne.

Alternatywnie, rozważ dyskretny rozkład dwuwymiarowy składający się z prawdopodobieństwa w 3 punktach (-1,1), (0, -1), (1,1) z prawdopodobieństwem odpowiednio 1/4, 1/2, 1/4. Następnie zmienne są nieskorelowane, ale zależne.

Rozważ dwuwymiarowe dane jednolite w rombie (kwadrat obrócony o 45 stopni). Zmienne będą nieskorelowane, ale zależne.

To są najprostsze przypadki, o których mogę myśleć.

Glen_b - Przywróć Monikę
źródło
Czy wszystkie zmienne losowe, które są symetryczne i wyśrodkowane wokół 0, są nieskorelowane?
Martin Thoma,
1
@moose Twój opis jest niejednoznaczny. Jeśli masz na myśli „jeśli jest symetryczny około zera, a Y jest symetryczny około zera”, to nie, ponieważ na przykład dwuwymiarową normalną ze standardowymi normalnymi marginesami można skorelować. Jeśli masz na myśli „jeśli X jest symetryczny względem zera, a Y jest parzystą funkcją X ”, to dopóki istnieją wariancje, uważam, że odpowiedź brzmi „tak”. Jeśli masz na myśli coś innego, musisz to wyjaśnić. XYXYX
Glen_b
7

Myślę, że istotę niektórych prostych kontrprzykładów można zobaczyć, rozpoczynając od ciągłej zmiennej losowej wyśrodkowanej na zero, tj. E [ X ] = 0 . Załóżmy, że pdf X jest parzysty i zdefiniowany w przedziale formy ( - a , a ) , gdzie a > 0 . Załóżmy teraz, że Y = f ( X ) dla niektórych funkcji f . Zadajemy teraz pytanie: dla jakich funkcji f ( X ) możemy mieć C oXmi[X]=0X(-za,za)za>0Y=fa(X)fafa(X) ?dooprzeciwko(X,fa(X))=0

Wiemy, że . Nasze założenie, że E [ X ] = 0 prowadzi nas prosto do C o v ( X , f ( X ) ) = E [ X fdooprzeciwko(X,fa(X))=mi[Xfa(X)]-mi[X]mi[fa(X)]mi[X]=0 . Oznaczając pdf X za pomocą p ( ) , mamydooprzeciwko(X,fa(X))=mi[Xfa(X)]Xp()

.dooprzeciwko(X,fa(X))=mi[Xfa(X)]=-zazaxfa(x)p(x)rex

Chcemy a jednym ze sposobów osiągnięcia tego jest zapewnienie, że f ( x ) jest funkcją parzystą, co oznacza, że x f ( x ) p ( x ) jest funkcją nieparzystą. Wynika z tego, że a - a x f ( x ) p ( x ) d x = 0 , a więc C o vdooprzeciwko(X,fa(X))=0fa(x)xfa(x)p(x)-zazaxfa(x)p(x)rex=0 .dooprzeciwko(X,fa(X))=0

W ten sposób widzimy, że dokładny rozkład jest nieważna jako wzdłuż jako pdf jest symetryczny wokół pewnym momencie i każdej nawet funkcja f ( ) zrobi dla definiowania Y .Xfa()Y

Mamy nadzieję, że pomoże to uczniom zobaczyć, jak ludzie wymyślają tego rodzaju kontrprzykłady.

Harjoat Bhamra
źródło
5

Bądź kontrprzykładem (tj. Pracowity student)! Powiedziawszy to:

Próbowałem wymyślić przykład z prawdziwego świata i był to pierwszy, który przyszedł mi do głowy. Nie będzie to matematycznie najprostszy przypadek (ale jeśli zrozumiesz ten przykład, powinieneś być w stanie znaleźć prostszy przykład z urnami i piłkami lub coś takiego).

Według niektórych badań średnie IQ mężczyzn i kobiet jest takie samo, ale wariancja męskiego IQ jest większa niż wariancja kobiecego IQ. Dla konkretności, powiedzmy, że męskie IQ następuje po a żeńskie IQ następuje po N ( 100 , α σ 2 ) z α < 1 . Połowa populacji to mężczyźni, a połowa populacji to kobiety.N(100,σ2)N(100,ασ2)α<1

Zakładając, że to badanie jest poprawne:

Jaka jest korelacja płci i IQ?

Czy płeć i IQ są niezależne?

Har
źródło
4

Możemy zdefiniować dyskretną zmienną losową z P ( X = - 1 ) = P ( X = 0 ) = P ( X = 1 ) = 1X{-1,0,1}P.(X=-1)=P.(X=0)=P.(X=1)=13)

a następnie zdefiniuj Y={1,JeśliX=00,Inaczej

Można łatwo zweryfikować, że i Y są nieskorelowane, ale nie niezależne.XY

UpartyAtom
źródło
2

Spróbuj tego (kod R):

x=c(1,0,-1,0);  
y=c(0,1,0,-1);  

cor(x,y);  
[1] 0

Wynika to z równania koła x2+y2r2=0

nie jest skorelowane z x , ale jest funkcjonalnie zależne (deterministyczne). Yx

Analityk
źródło
1
Zerowa korelacja próbki nie oznacza, że ​​prawdziwa korelacja wynosi zero.
mpiktas
3
@mpiktas Jeśli te cztery wartości reprezentują rozkład dwuwymiarowy z prawdopodobieństwem 1/4, corfunkcja zwracająca zero wskaże korelację populacji wynoszącą zero.
Glen_b
@Glen_b Powinienem był lepiej komentować kod. To może nie być znane wszystkim. Można użyć średników, które moim zdaniem nie są zalecane jako styl kodowania w R.
Analyst
1
@Glen_b tak masz rację. Ale tego nie stwierdzono. Niezła obserwacja btw.
mpiktas
1

Jedynym ogólnym przypadkiem, gdy brak korelacji implikuje niezależność, jest to, że łączny rozkład X i Y ma charakter Gaussa.

Frederik Meinertsen
źródło
2
Nie odpowiada to bezpośrednio na pytanie, podając prosty przykład - w tym sensie jest raczej komentarzem - ale daje pośrednią odpowiedź, ponieważ sugeruje bardzo szeroki zestaw możliwych przykładów. Być może warto przeredagować ten post, aby wyjaśnić, w jaki sposób odpowiada on na pierwotne pytanie.
Silverfish,
-1

Odpowiedź na dwa zdania: najjaśniejszym przypadkiem nieskorelowanej zależności statystycznej jest nieliniowa funkcja RV, powiedzmy Y = X ^ n. Dwa RV są wyraźnie zależne, ale nie są skorelowane, ponieważ korelacja jest relacją liniową.

John Strong
źródło
XXY=Xn
Ta odpowiedź jest niepoprawna. W R: Wyrażenie: {x <- runif (100); cor (x, x ^ 3)} Wynik: 0,9062057
Josh