Przykłady niezależnych i nieskorelowanych danych w prawdziwym życiu oraz sposoby ich pomiaru / wykrywania

20

Zawsze słyszymy o tym wektorze danych VS ten inny wektor danych jest od siebie niezależny, nieskorelowany itp. I chociaż łatwo jest znaleźć matematykę dotyczącą tych dwóch pojęć, chcę je połączyć w przykłady z rzeczywistych życie, a także znaleźć sposoby na zmierzenie tego związku.

Z tego punktu widzenia szukam przykładów dwóch sygnałów, które mają następujące kombinacje: (zacznę od niektórych):

  • Dwa sygnały, które są niezależne ORAZ (niekoniecznie) nieskorelowane:

    • Hałas silnika samochodu (nazwij to ) i twój głos ( v 2 [ n ] ) podczas mówienia.v1[n]v2[n]
    • Rejestrowanie wilgotności każdego dnia ( ) i wskaźnik Dow-Jonesa ( v 2 [ n ] ).v1[n]v2[n]

P1) Jak zmierzyłbyś / udowodnić, że są one niezależne od tych dwóch wektorów w ręku? Wiemy, że niezależność oznacza, że ​​iloczyn ich plików pdf jest równy ich wspólnemu plikowi pdf, i to świetnie, ale jak te dwa wektory są w dłoni, w jaki sposób można udowodnić ich niezależność?

  • Dwa sygnały, które NIE są niezależne, ale wciąż nieskorelowane:

Q2) Nie mogę tutaj wymyślić żadnych przykładów ... jakie byłyby niektóre przykłady? Wiem, że możemy zmierzyć korelację, biorąc korelację krzyżową dwóch takich wektorów, ale jak moglibyśmy udowodnić, że NIE są one również niezależne?

  • Dwa skorelowane sygnały:
    • Wektor mierzący głos śpiewaczki operowej w głównej sali, , podczas gdy ktoś nagrywa jej głos gdzieś w budynku, powiedzmy w sali prób ( wer. 2 [ n ] ).v1[n]v2[n]
    • Jeśli ciągle mierzysz tętno w samochodzie ( ), a także mierzysz intensywność niebieskich świateł uderzających w tylną szybę ( v 2 [ n ] ) ... Domyślam się, że byłyby one bardzo skorelowane ... :-)v1[n]v2[n]

Q3) W odniesieniu do q2, ale czy w przypadku pomiaru korelacji krzyżowej z tego punktu empirycznego wystarczy spojrzeć na iloczyn punktowy tych wektorów (ponieważ jest to wartość na szczycie ich korelacji krzyżowej)? Dlaczego mielibyśmy przejmować się innymi wartościami w funkcji cross-corr?

Jeszcze raz dziękuję, im więcej przykładów podano, tym lepiej do budowania intuicji!

Spacey
źródło
@DilipSarwate Dzięki Dilip, przyjrzę się temu. Na razie jednak niektóre przykłady byłyby dobre.
Spacey
Nie możesz „udowodnić”, że są niezależni w taki sam sposób, że nawet dobrze skonstruowana ankieta nie może „udowodnić”, jak wszyscy będą głosować - i z tych samych powodów.
Jim Clay
@JimClay Zapraszam do rozluźnienia kryterium „udowodnij” - staram się uzyskać sposoby pomiaru / oceny niezależności. Często słyszymy o tym, a więc o byciu niezależnym, skąd oni to wiedzą? Jaka taśma pomiarowa jest używana?
Spacey
Chciałbym wiedzieć, czy dla celów analizy można zastosować korelację krzyżową dla dwóch sygnałów analogowych: wysokiej i drugiej o niskiej rozdzielczości.
Jeśli mamy jakąś zmienną losową X i konstruujemy 2 sygnały a ** = (x) i ** b ** = f 2 (x), przy czym f 1 i f 2 są ortogonalne, a ** x = a + bf1f2f1f2 . Czy to oznaczałoby, że takie sygnały są niezależne? Czy to wymaga dodatkowych warunków? Ta nieruchomość byłaby interesująca, ponieważ zapobiega konstruowaniu wspólną wersję i b .
Mladen,

Odpowiedzi:

9

Kilka elementów ... (Wiem, że to nie jest wyczerpujące, bardziej kompletna odpowiedź powinna prawdopodobnie wspomnieć o chwilach)

Pytanie 1

Aby sprawdzić, czy dwa rozkłady są niezależne, należy zmierzyć, jak podobny jest ich łączny rozkład do iloczynu ich rozkładu krańcowego p ( x ) × p ( y ) . W tym celu można użyć dowolnej odległości między rozkładami. Jeśli użyjesz rozbieżności Kullbacka-Leiblera do porównania tych rozkładów, weźmiesz pod uwagę ilość:p(x,y)p(x)×p(y)

xyp(x,y)logp(x,y)p(x)p(y)dxdy

I rozpoznasz ... wzajemne informacje! Im jest niższy, tym bardziej niezależne są zmienne.

Praktycznie, aby obliczyć tę ilość na podstawie obserwacji, możesz albo oszacować gęstość , p ( y ) , p ( x , y ) z danych za pomocą estymatora gęstości jądra i wykonać integrację numeryczną na drobnej siatce ; lub po prostu skwantyfikuj swoje dane do N przedziałów i użyj wyrażenia informacji wzajemnych dla dyskretnych dystrybucji.p(x)p(y)p(x,y)N

Q2

Ze strony Wikipedii na temat niezależności statystycznej i korelacji:

Działki dystrybucyjne

p(x,y)p(x)p(y)

Pytanie 3

Rzeczywiście istnieją sytuacje, w których można spojrzeć na wszystkie wartości funkcji korelacji krzyżowej. Powstają one na przykład w przetwarzaniu sygnału audio. Rozważ dwa mikrofony przechwytujące to samo źródło, ale odległe od kilku metrów. Korelacja krzyżowa dwóch sygnałów będzie miała silny pik przy opóźnieniu odpowiadającym odległości między mikrofonami podzielonej przez prędkość dźwięku. Jeśli popatrzysz na korelację krzyżową z opóźnieniem 0, nie zobaczysz, że jeden sygnał jest przesuniętą w czasie wersją drugiego!

fenenety
źródło
p(x,y)p(x}
(ciąg dalszy) 2) Podsumowując: jeśli macierz kowariancji xiy jest przekątna, to są one nieskorelowane, ale niekoniecznie niezależne, prawda? Sprawdzenie niezależności było kwestią pytania uzupełniającego (1). Jeśli jednak wykażemy, że są niezależne, wówczas ich macierz kowariancji MUSI być diagonalna. Czy dobrze zrozumiałem? Jaki jest przykład 2 fizycznych sygnałów, które mogę zmierzyć w prawdziwym życiu, które byłyby zależne, ale nie skorelowane? Dzięki jeszcze raz.
Spacey
1
xnynNp(x,y)p(x,y)=i1NK(xxi,yyi)K(xn,yn)p(x,y)=CNC(x,y)
1
„2 sygnały fizyczne, które byłyby zależne, ale nie skorelowane”: Powiedzmy, że włamujemy się do GPS taksówki w Nowym Jorku, aby zarejestrować (szerokość, długość) historię jej pozycji. Jest duża szansa, że ​​łat., Długo. dane będą nieskorelowane - nie ma uprzywilejowanej „orientacji” chmury punktów. Ale to raczej nie będzie niezależne, ponieważ gdybyś został poproszony o odgadnięcie szerokości kabiny, lepiej byś zgadł, gdybyś znał długość geograficzną (możesz wtedy spojrzeć na mapę i wykluczyć [łac. długie] pary zajmowane przez budynki).
fenenety
Kolejny przykład: dwie sinusoidy falują w liczbie całkowitej wielokrotności tej samej częstotliwości. Korelacja zerowa (podstawa Fouriera jest ortonormalna); ale jeśli znasz wartość jednego, istnieje tylko skończony zestaw wartości, które drugi może przyjąć (pomyśl o fabule Lissajousa).
fenenety
5

Wnioskowanie, czy dwa sygnały są niezależne, jest bardzo trudne (biorąc pod uwagę skończone obserwacje) bez wcześniejszej wiedzy / założeń.

XYXYYXY

cov(f1(X),f2(Y))=E(f1(X),f2(Y))=0
f1f2XYf1(x)=f2(x)=x

E(XiYj)

X(t)Y(t)

SX,Y(f),SX2,Y(f),SX,Y2(f)
f

Przykład :

X(t)=sin(2πft)
Y(t)=sin(2πftk)
kZk1X(t)Y(t)sin(kx)sin(x)
Y(t)=f(X(t))
f

X(t)Y(t)

rwolst
źródło
Xx2,Y(f)
X2(t)Y(t)