Czy istnieje ogólna zasada określająca, czy należy obliczyć korelację Pearsona dla dwóch zmiennych losowych X i Y przed podjęciem ich transformacji logicznej, czy po niej? Czy istnieje procedura sprawdzania, która jest bardziej odpowiednia? Dają podobne, ale różne wartości, ponieważ transformacja logarytmiczna jest nieliniowa. Czy zależy to od tego, czy X lub Y są bliższe normalności po zalogowaniu? Jeśli tak, dlaczego to ma znaczenie? Czy to oznacza, że należy wykonać test normalności X i Y względem log (X) i log (Y) i na tej podstawie zdecydować, czy pearson (x, y) jest bardziej odpowiedni niż pearson (log (x), log ( y))?
regression
correlation
logarithm
pearson-r
użytkownik9097
źródło
źródło
Odpowiedzi:
Ponieważ i są monotonicznymi transformacjami danych i , możesz również wybrać korelację rang Spearmana ( ) i nie martwić się o przekształcenie danych, tak jak byś otrzymałlog( X) log( Y) X Y ρS. ρS.( X, Y) =ρS.( log( X) , log( Y) )
źródło
Korelacja (pearsona) mierzy liniową zależność między dwiema zmiennymi ciągłymi. Nie ma takiego wyboru dla (X, Y) lub (log X, log Y). Wykres rozproszenia zmiennych można wykorzystać do zrozumienia zależności.
Poniższy link może odpowiedzieć na pytanie dotyczące normalności. połączyć
źródło
Korelacja Pearsona służy do testowania parametrycznego i ma większą moc niż test nieparametryczny. Dlatego wybieramy transformację przed wszelkimi nieparametrycznymi procedurami. Przekształć swoje dane i uzyskaj korelację gruszek. Otóż to.
źródło