Jak rozumiem, możemy uzyskać korelację poprzez normalizację kowariancji za pomocą równania
gdzie to odchylenie standardowe . Xi
Moje obawy dotyczą tego, czy odchylenie standardowe wynosi zero? Czy jest jakiś warunek, który gwarantuje, że nie może wynosić zero?
Dzięki.
correlation
standard-deviation
covariance
Chepukha
źródło
źródło
Odpowiedzi:
Prawdą jest, że jeśli jedno z twoich SD ma wartość 0, równanie to jest niezdefiniowane. Jednak lepszym sposobem myślenia o tym jest to, że jeśli jedna z twoich SD ma wartość 0, nie ma korelacji. W luźnych pojęciach korelacja mówi ci o tym, jak jedna zmienna porusza się, podczas gdy druga zmienna się porusza. SD 0 oznacza, że zmienna nie „porusza się”. Musisz mieć wektor stałej, takiej jak
rep(constant, n_times)
.źródło
Inną rzeczą do przemyślenia są podstawowe założenia, kiedy mówimy o średnich i odchyleniach standardowych oraz korelacjach.
Jeśli mówimy o próbce danych, jednym z powszechnych założeń jest to, że dane są (przynajmniej w przybliżeniu) normalnie dystrybuowane lub mogą być transformowane w taki sposób (np. Poprzez transformację logów). Jeśli zaobserwujesz odchylenie standardowe wynoszące zero, istnieją dwa scenariusze: albo odchylenie standardowe jest w rzeczywistości niezerowe, ale bardzo małe, a zatem zestaw danych, który masz, zawiera próbki, które są na wartości średniej (może to na przykład się zdarzyć jeśli mierzysz dane z grubym poziomem dokładności); lub model jest źle określony.
W tym drugim scenariuszu odchylenie standardowe, a w konsekwencji korelacja, jest miarą bez znaczenia.
Mówiąc bardziej ogólnie, oba leżące u podstaw rozkłady muszą mieć skończone drugie chwile, a zatem niezerowe odchylenia standardowe, aby korelacja była prawidłową koncepcją.
źródło
Korelacja to cosinus kąta między dwoma wektorami. Stwierdzenie, że odchylenie standardowe dla Y wynosi zero, jest tym samym, co powiedzenie, że wektor Y-średnia (Y) wynosi zero (lub, bardziej rygorystycznie, że reprezentuje zero w odpowiedniej przestrzeni wektorowej). Powstaje więc pytanie: „Co można powiedzieć o (cosinusie) kąta między wektorem zerowym a wektorem X-średnia (X)?”. Mówiąc bardziej ogólnie, w jakiejkolwiek przestrzeni wektorowej z iloczynem wewnętrznym, co oznacza kąt między wektorem zerowym a jakimś innym wektorem? Moim zdaniem jest na to tylko jedna odpowiedź, a mianowicie, że pojęcie „kąta” w tej sytuacji jest pozbawione znaczenia, a zatem pojęcie korelacji w tej sytuacji jest bez znaczenia.
źródło
Zastrzeżenie, zdaję sobie sprawę, że istnieje już akceptowana odpowiedź jakościowa, więc powinna to być odpowiedź, ale nie mam punktów doświadczenia, aby na to pozwolić. @Dilip wspomniał, że można zdefiniować korelację jako 0 dla konwencji, ale wydaje się to problematyczne, ponieważ miałaby zupełnie inną interpretację niż korelacja, która jest naprawdę zerowa (z niezerowymi SD). Pierwotne pytanie brzmi „jeśli SD jednej zmiennej wynosi zero”. Jeśli zatrzymamy się i pomyślimy o definicji „zmiennej”, otrzymamy znacznie bardziej bezpośrednią ścieżkę do odpowiedzi. Zmienna z 0 SD wcale nie jest zmienną, jest stałą. W takim przypadku nie masz dwóch zmiennych, więc koncepcyjnie nie ma sensu definiowanie korelacji.
źródło