Uśrednianie wartości korelacji

20

Powiedzmy, że testuję, jak zmienna Yzależy od zmiennej Xw różnych warunkach eksperymentalnych i otrzymuję następujący wykres:

wprowadź opis zdjęcia tutaj

Linie przerywane na powyższym wykresie reprezentują regresję liniową dla każdej serii danych (konfiguracja eksperymentalna), a liczby w legendzie oznaczają korelację Pearsona dla każdej serii danych.

Chciałbym obliczyć „średnią korelację” (lub „średnią korelację”) pomiędzy Xi Y. Czy mogę po prostu uśrednić rwartości? Co z „średnim kryterium determinacji”, ? Czy powinienem obliczyć średnią, a następnie obliczyć kwadrat tej wartości, czy też powinienem obliczyć średnią poszczególnych ?R 2R2rR2

Boris Gorelik
źródło

Odpowiedzi:

15

Prostym sposobem jest dodanie zmiennej jakościowej celu zidentyfikowania różnych warunków eksperymentalnych i włączenia jej do modelu wraz z „interakcją” z ; to znaczy, . Prowadzi to jednocześnie wszystkie pięć regresji. Jego jest tym, czego chcesz.x y z + x # z R 2zxyz+x#zR2

Aby zobaczyć, dlaczego uśrednianie poszczególnych wartości może być błędne, załóżmy, że kierunek nachylenia jest odwrócony w niektórych warunkach eksperymentalnych. Oceniłbyś wiązkę 1 i -1 na około 0, co nie odzwierciedlałoby jakości żadnego z pasowań. Aby zobaczyć, dlaczego uśrednianie (lub jakiejkolwiek jego ustalonej transformacji) jest niewłaściwe, załóżmy, że w większości warunków eksperymentalnych miałeś tylko dwie obserwacje, tak że ich równa się , ale w jednym eksperymencie miałeś sto obserwacji z . Średnia wynosząca prawie 1 nie odzwierciedlałaby poprawnie sytuacji.R 2 R 2 1 R 2 = 0 R 2RR2R21R2=0R2

Whuber
źródło
1
wybacz moją ignorancję, ale co oznacza znak # w twojej odpowiedzi?
Boris Gorelik,
1
Myślę, że twoja odpowiedź jest bardzo dobra dla domyślnej użytej definicji korelacji. Co jeśli mieliby to na myśli jako znormalizowane nachylenie (być może sugerowane przez rysunek)? W takim przypadku chcesz anulować negatywy i pozytywy. Nie masz pojęcia o problemie z wielkością próbki. Rozważ też przeniesienie komentarza do odpowiedzi.
Jan
Czy chcesz czy skorygowany ? R 2R2R2
russellpierce
@ whuber w twoim początkowym komentarzu, masz na myśli, że korelacja może wynosić ; jest w każdym przypadku . (Zdaję sobie sprawę, że jest to tylko kwestia pisania lub edytowania; to nie zmienia twojego punktu, ale może wprowadzać w błąd.)R 2 1±1R21
Glen_b
@rpierce W drugim akapicie nie ma znaczenia dla pomysłów, jeśli użyjesz skorygowanego prostu wyobraź sobie zestawy trzech , a nie dwóch punktów, które są prawie współliniowe. Ich skorygowane może być dowolnie bliskie . R 2 1R2R21
whuber
24

W przypadku współczynników korelacji Pearsona ogólnie właściwe jest przekształcenie wartości r za pomocą transformacji Fis z . Następnie uśrednij wartości z i przekonwertuj średnią z powrotem na wartość r .

Wyobrażam sobie, że byłoby dobrze również dla współczynnika Spearmana.

Oto artykuł i wpis w Wikipedii .

Amyunimus
źródło
1
+1; Ta odpowiedź wydaje się bardziej odpowiednia i ogólna niż odpowiedź zaakceptowana, jednak w konkretnym przypadku użycia nie rozpadłaby się dla wartości r wynoszących 1? Czy jest tu coś w rodzaju logiki imperialnej, w której wystarczy „dodać” punkt danych pozbawiony korelacji? Jeśli tak, to gdzie go dodać? Czy trzeba przeprowadzić Monte Carlo SIM, zbierając dwie losowe zmienne z rozkładów źródłowych? Alternatywnie czy po prostu dostosujesz r do wartości nieco mniejszej niż 1? Jak daleko należy się dostosować?
russellpierce
3

Średnia korelacja może być znacząca. Weź również pod uwagę rozkład korelacji (na przykład wykreśl histogram).

Ale, jak rozumiem, dla każdej osoby masz pewien ranking przedmiotów oraz przewidywane rankingi tych przedmiotów dla tej osoby i patrzysz na korelację między rankingami danej osoby a przewidywanymi.n

W takim przypadku może się zdarzyć, że korelacja nie jest najlepszą miarą skuteczności algorytmu w prognozowaniu. Wyobraźmy sobie na przykład, że algorytm perfekcyjnie uzyskuje pierwsze 100 elementów, a kolejne 200 elementów jest całkowicie pomieszane, a wręcz przeciwnie. Możliwe, że zależy Ci tylko na jakości najlepszych rankingów. W tym przypadku, można spojrzeć na sumę bezwzględnych różnic między poszczególnymi w rankingu i przewidywany rankingu, ale tylko wśród czołowych jednostki przedmiotów.m

Karl
źródło
1

Co powiesz na użycie średniej kwadratowej przewidywanej wartości błędu (MSPE) do działania algorytmu? Jest to standardowe podejście do tego, co próbujesz zrobić, jeśli próbujesz porównać wydajność predykcyjną wśród zestawu algorytmów.

StatsStudent
źródło
Nie jestem pewien, dlaczego ten post stats.stackexchange.com/questions/17129/... został połączony z tym. W mojej opozycji zadają dwa różne pytania - są dwa różne cele.
StatsStudent
1
Masz rację: są to różne pytania. Głosowałem za ponownym otwarciem drugiego postu (choć nie wiadomo, jaki efekt może to mieć). Przepraszam, że nie widziałem twojego komentarza: gdyby zamiast tego oflagowałeś ten post, zwróciłby on naszą uwagę kilka lat wcześniej!
whuber