Kowariancja i niezależność?

54

Z podręcznika przeczytałem, że nie gwarantuje, że X i Y są niezależne. Ale jeśli są niezależni, ich kowariancja musi wynosić 0. Nie potrafiłem jeszcze wymyślić żadnego właściwego przykładu; czy ktoś mógłby to zapewnić?cov(X,Y)=0

Latająca świnia
źródło
10
Możesz także zapoznać się z krótkim przeglądem Kwartetu Anscombe , który ilustruje niektóre z wielu różnych sposobów, w jaki konkretna niezerowa kowariancja może być zrealizowana przez dwuwymiarowy zestaw danych.
whuber
7
Należy zauważyć, że miarą kowariancji jest miara liniowości. Obliczenie kowariancji odpowiada na pytanie „Czy dane tworzą wzór linii prostej?” Jeżeli dane mają wzór liniowy, są zatem zależne. ALE to tylko jeden sposób, w jaki dane mogą być zależne. To jak pytanie „Czy prowadzę lekkomyślnie?” Jedno pytanie może brzmieć: „Czy przekraczasz limit prędkości o 25 km / h?” Ale to nie jedyny sposób na lekkomyślne prowadzenie pojazdu. Kolejne pytanie może brzmieć: „Czy jesteś pijany?” itp. Istnieje więcej niż jeden sposób na lekkomyślne prowadzenie pojazdu.
Adam
Tak zwana miara liniowości nadaje strukturę relacji. Co ważne, związek może być nieliniowy, co nie jest rzadkie. Zasadniczo kowariancja nie jest równa zeru, jest hipotetyczna. Kowariancja wskazuje wielkość, a nie stosunek,
Subhash C. Davar

Odpowiedzi:

48

Prosty przykład: niech będzie zmienną losową, która wynosi lub z prawdopodobieństwem 0,5. Niech więc będzie zmienną losową, tak że jeśli , a jest losowo lub z prawdopodobieństwem 0,5, jeśli .- 1 + 1 Y Y = 0 X = - 1 Y - 1 + 1 X = 1X1+1YY=0X=1Y1+1X=1

Najwyraźniej i są wysoce zależne (ponieważ znajomość pozwala mi doskonale poznać ), ale ich kowariancja wynosi zero: oba mają zerową średnią, iT Y XXYYX

E[XY]=(1)0P(X=1)+11P(X=1,Y=1)+1(1)P(X=1,Y=1)=0.

Lub bardziej ogólnie, weź dowolny rozkład i dowolny taki, że dla wszystkich (tj. Łączny rozkład, który jest symetryczny wokół osi ) i zawsze będziesz mieć zerową kowariancję. Ale będziesz miał niezależność, ilekroć ; tzn. warunki warunkowe nie są równe wartości brzeżnej. Lub to samo dla symetrii wokół osi .P(X)P(Y|X)P(Y=a|X)=P(Y=a|X)XxP(Y|X)P(Y)y

jpillow
źródło
32

Oto przykład, który zawsze daję uczniom. Weź zmienną losową o i , np. Normalna zmienna losowa ze średnią zero. Weź . Oczywiste jest, że i są powiązane, aleXEX=0EX3=0Y=X2XY

cov(X,Y)=EXYEXEY=EX3=0.
mpiktas
źródło
Ten przykład też mi się podoba. W szczególnym przypadku Nv (0,1) rv i chi2 (1) rv są nieskorelowane.
ocram
3
+1, ale jako drobne drobne, musisz założyć, że osobno (nie wynika to z założenia symetrii rozkładu lub z ), więc nie mają takie problemy, jak , które mają postać . I jestem przewrażliwiony na temat użytkownika @ ocram twierdzenie, że „ N (0,1) dzieci i chi2 (1) dzieci są nieskorelowane.” (wyróżnienie dodane) Tak, i są nieskorelowane, ale nie ma żadnych zmiennych losowych i . E [ X ] = 0 E [ X 3 ] - X N ( 0 , 1 ) X 2χ 2 ( 1 ) N ( 0 , 1 ) χ 2 ( 1 )E[X3]=0E[X]=0E[X3]XN(0,1)X2χ2(1) N(0,1)χ2(1)
Dilip Sarwate
@DilipSarwate, dzięki, odpowiednio zredagowałem swoją odpowiedź. Kiedy to napisałem, pomyślałem o zmiennych normalnych, dla nich zero trzeciego momentu wynika ze średniej zero.
mpiktas
19

Poniższy obraz (źródłowa Wikipedia ) zawiera wiele przykładów w trzecim rzędzie, w szczególności pierwszy i czwarty przykład mają silną zależność, ale 0 korelacji (i 0 kowariancji).

wprowadź opis zdjęcia tutaj

naught101
źródło
15

W niektórych innych przykładach rozważ punkty danych, które tworzą okrąg lub elipsę, kowariancja wynosi 0, ale znając x zawęzisz y do 2 wartości. Lub dane w kwadracie lub prostokącie. Również dane, które tworzą X, V, ^ lub <lub>, dają kowariancję 0, ale nie są niezależne. Jeśli y = sin (x) (lub cos) i x obejmuje całkowitą wielokrotność kropek, to cov będzie równe 0, ale znając x znasz y lub przynajmniej | y | w przypadkach elipsy, x, <i>.

Greg Snow
źródło
1
To, że powinno być „jeśli x obejmuje całkowitą wielokrotność okresów rozpoczynających się od szczytu lub dołka”, lub bardziej ogólnie: „Jeśli x obejmuje przedział, w którym y jest symetryczny”
naught101