Współczynnik Pearsona między dwiema zmiennymi jest dość wysoki (r = 0,65). Ale kiedy oceniam wartości zmiennych i przeprowadzam korelację Spearmana, wartość współczynnika jest znacznie niższa (r = 0,30).
- Jaka jest tego interpretacja?
correlation
spearman-rho
user3671
źródło
źródło
Odpowiedzi:
Dlaczego duża różnica
Jeśli twoje dane są zwykle dystrybuowane lub równomiernie dystrybuowane, uważam, że korelacja Spearmana i Pearsona powinna być dość podobna.
Jeśli dają one bardzo różne wyniki, jak w twoim przypadku (.65 w porównaniu z .30), domyślam się, że wypaczyłeś dane lub wartości odstające i że wartości odstające powodują, że korelacja Pearsona jest większa niż korelacja Spearmana. To znaczy, bardzo wysokie wartości na X mogą współistnieć z bardzo wysokimi wartościami na Y.
Powiązane pytania
Zobacz także poprzednie pytania dotyczące różnic między korelacją Spearmana i Pearsona:
Jak wybrać korelację Pearsona i Spearmana?
Korelacja Pearsona lub Spearmana z danymi niestandardowymi
Prosty przykład R.
Poniżej przedstawiono prostą symulację tego, jak może to nastąpić. Zauważ, że poniższy przypadek dotyczy pojedynczej wartości odstającej, ale możesz uzyskać podobne efekty z wieloma wartościami odstającymi lub przekrzywionymi danymi.
Co daje ten wynik
Analiza korelacji pokazuje, że bez wartości odstających Spearman i Pearson są dość podobne, a przy skrajnej wartości odstającej korelacja jest zupełnie inna.
Poniższy wykres pokazuje, jak traktowanie danych jako rang eliminuje ekstremalny wpływ wartości odstającej, przez co Spearman jest podobny zarówno z wartością odstającą, jak i bez niej, podczas gdy Pearson jest zupełnie inny, gdy dodaje się wartość odstającą. To podkreśla, dlaczego Spearman często nazywany jest solidnym.
źródło