Każdy przykład (z grubsza) zmiennych niezależnych, które są zależne od ekstremalnych wartości?

14

Szukam przykładu 2 losowych zmiennych X , Y takich, że

|cor(X,Y)|0

ale jeśli wziąć pod uwagę tylną część rozkładów, są one wysoce skorelowane. (Staram się unikać „korelacji” / „korelacji” dla ogona, ponieważ może on nie być liniowy).

Prawdopodobnie skorzystaj z tego:

|cor(X,Y)|0

gdzie jest uwarunkowane X> 90 \% populacji X , a Y' jest zdefiniowane w tym samym znaczeniu. X > 90 % X Y XX>90%XY

Kmz
źródło
8
Niezależne zmienne, które są zależne? Mój mózg właśnie eksplodował. Tego rodzaju pytania nie można zadać w poniedziałek rano
Aksakal
1
Biorąc pod uwagę pozytywną odpowiedź, to pytanie Q wydaje się możliwe.
gung - Przywróć Monikę
1
Aby to miało sens dla ludzi, zastanów się, jak bardzo zależy ci na problemach z bronią i jak bardzo lubisz / nienawidzisz NRA. Korelacja będzie prawdopodobnie bliska zeru. Ludzie, którym najbardziej zależy na kwestiach związanych z bronią, mogą kochać lub nienawidzić NRA. Ale będą bardzo zależni. Ludzie, którym najbardziej zależy na kwestiach związanych z bronią, prawie nigdy nie znajdą się w środku spektrum pro-NRA / anty-NRA. Ludzie z górnej lub dolnej części spektrum pro-NRA / anty-NRA będą bardziej dbać o problemy z bronią niż ludzie w środku.
David Schwartz
1
Przykro mi z powodu niejasnego pytania. Chcę tylko wyobrazić sobie, jak to działa w przypadku niektórych niezależnych dystrybucji o pewnej ekstremalnej zależności (niekoniecznie korelacji).
Kmz
2
Istnieje wiele kopuł o słabej ogólnej zależności, ale silnej zależności od ogona; na dokładną ogólną korelację miałby wpływ rozkład rozkładów marginalnych.
Glen_b

Odpowiedzi:

23

Oto przykład, w którym i mają nawet normalne marginesy.YXY

Pozwolić:

XN(0,1)

Warunkowo na , niech jeśli lub przeciwnym razie, dla pewnej stałej .Y = X | X | > ϕ Y = - X ϕXY=X|X|>ϕY=Xϕ

Możesz pokazać, że niezależnie od , marginalnie mamy:ϕ

YN(0,1)

Istnieje wartość taka, że . Jeśli to .ϕcor(X,Y)=0ϕ=1.54cor(X,Y)0

Jednak i nie są niezależne, a skrajne wartości obu są całkowicie zależne. Zobacz symulację w R poniżej i poniższy wykres.XY

Nsim <- 10000
set.seed(123)

x <- rnorm(Nsim)
y <- ifelse(abs(x)>1.54,x,-x)

print(cor(x,y)) # 0.00284 \approx 0

plot(x,y)

extreme.x <- which(abs(x)>qnorm(0.95))
extreme.y <- which(abs(y)>qnorm(0.95))
extreme.both <- intersect(extreme.x,extreme.y)

print(cor(x[extreme.both],y[extreme.both])) # Exactly 1

wprowadź opis zdjęcia tutaj

Chris Haug
źródło
1
(+1) Jeśli chcesz, aby rozkład był nie tylko nieskorelowany, ale także niezbyt zależny, możesz wykonać jego modyfikację, która zastąpi zamianę progu twardego rozmytym. Trudniej jest wyrównać matematykę, ale jest to wykonalne.
Matthew Graves
1
Dziękuję Chris Haug! Twój pomysł pomaga mi zwizualizować to, co robię.
Kmz