Zawsze słyszymy o tym wektorze danych VS ten inny wektor danych jest od siebie niezależny, nieskorelowany itp. I chociaż łatwo jest znaleźć matematykę dotyczącą tych dwóch pojęć, chcę je połączyć w przykłady z rzeczywistych życie, a także znaleźć sposoby na zmierzenie tego związku.
Z tego punktu widzenia szukam przykładów dwóch sygnałów, które mają następujące kombinacje: (zacznę od niektórych):
Dwa sygnały, które są niezależne ORAZ (niekoniecznie) nieskorelowane:
- Hałas silnika samochodu (nazwij to ) i twój głos ( v 2 [ n ] ) podczas mówienia.
- Rejestrowanie wilgotności każdego dnia ( ) i wskaźnik Dow-Jonesa ( v 2 [ n ] ).
P1) Jak zmierzyłbyś / udowodnić, że są one niezależne od tych dwóch wektorów w ręku? Wiemy, że niezależność oznacza, że iloczyn ich plików pdf jest równy ich wspólnemu plikowi pdf, i to świetnie, ale jak te dwa wektory są w dłoni, w jaki sposób można udowodnić ich niezależność?
- Dwa sygnały, które NIE są niezależne, ale wciąż nieskorelowane:
Q2) Nie mogę tutaj wymyślić żadnych przykładów ... jakie byłyby niektóre przykłady? Wiem, że możemy zmierzyć korelację, biorąc korelację krzyżową dwóch takich wektorów, ale jak moglibyśmy udowodnić, że NIE są one również niezależne?
- Dwa skorelowane sygnały:
- Wektor mierzący głos śpiewaczki operowej w głównej sali, , podczas gdy ktoś nagrywa jej głos gdzieś w budynku, powiedzmy w sali prób ( wer. 2 [ n ] ).
- Jeśli ciągle mierzysz tętno w samochodzie ( ), a także mierzysz intensywność niebieskich świateł uderzających w tylną szybę ( v 2 [ n ] ) ... Domyślam się, że byłyby one bardzo skorelowane ... :-)
Q3) W odniesieniu do q2, ale czy w przypadku pomiaru korelacji krzyżowej z tego punktu empirycznego wystarczy spojrzeć na iloczyn punktowy tych wektorów (ponieważ jest to wartość na szczycie ich korelacji krzyżowej)? Dlaczego mielibyśmy przejmować się innymi wartościami w funkcji cross-corr?
Jeszcze raz dziękuję, im więcej przykładów podano, tym lepiej do budowania intuicji!
źródło
Odpowiedzi:
Kilka elementów ... (Wiem, że to nie jest wyczerpujące, bardziej kompletna odpowiedź powinna prawdopodobnie wspomnieć o chwilach)
Pytanie 1
Aby sprawdzić, czy dwa rozkłady są niezależne, należy zmierzyć, jak podobny jest ich łączny rozkład do iloczynu ich rozkładu krańcowego p ( x ) × p ( y ) . W tym celu można użyć dowolnej odległości między rozkładami. Jeśli użyjesz rozbieżności Kullbacka-Leiblera do porównania tych rozkładów, weźmiesz pod uwagę ilość:p(x,y) p(x)×p(y)
I rozpoznasz ... wzajemne informacje! Im jest niższy, tym bardziej niezależne są zmienne.
Praktycznie, aby obliczyć tę ilość na podstawie obserwacji, możesz albo oszacować gęstość , p ( y ) , p ( x , y ) z danych za pomocą estymatora gęstości jądra i wykonać integrację numeryczną na drobnej siatce ; lub po prostu skwantyfikuj swoje dane do N przedziałów i użyj wyrażenia informacji wzajemnych dla dyskretnych dystrybucji.p(x) p(y) p(x,y) N
Q2
Ze strony Wikipedii na temat niezależności statystycznej i korelacji:
Pytanie 3
Rzeczywiście istnieją sytuacje, w których można spojrzeć na wszystkie wartości funkcji korelacji krzyżowej. Powstają one na przykład w przetwarzaniu sygnału audio. Rozważ dwa mikrofony przechwytujące to samo źródło, ale odległe od kilku metrów. Korelacja krzyżowa dwóch sygnałów będzie miała silny pik przy opóźnieniu odpowiadającym odległości między mikrofonami podzielonej przez prędkość dźwięku. Jeśli popatrzysz na korelację krzyżową z opóźnieniem 0, nie zobaczysz, że jeden sygnał jest przesuniętą w czasie wersją drugiego!
źródło
Wnioskowanie, czy dwa sygnały są niezależne, jest bardzo trudne (biorąc pod uwagę skończone obserwacje) bez wcześniejszej wiedzy / założeń.
Przykład :
źródło