Jakie skuteczne metody korelacji są rzeczywiście stosowane?

18

Planuję przeprowadzić badanie symulacyjne, w którym porównuję wydajność kilku solidnych technik korelacji z różnymi rozkładami (wypaczonymi, z wartościami odstającymi itp.). Przez solidne rozumiem idealny przypadek bycia odpornym na a) wypaczone rozkłady, b) wartości odstające i c) ciężkie ogony.

Wraz z korelacją Pearsona jako punktem odniesienia, myślałem o uwzględnieniu następujących bardziej solidnych miar:

  • Spearman's ρ
  • Korelacja zgięcia procentowego (Wilcox, 1994, [1])
  • Elipsoida minimalnej objętości, wyznacznik minimalnej kowariancji ( cov.mve/ cov.mcdz cor=TRUEopcją)
  • Prawdopodobnie korelacja winsorized

Oczywiście istnieje wiele innych opcji (zwłaszcza jeśli uwzględnisz również solidne techniki regresji), ale chcę ograniczyć się do najczęściej używanych / najbardziej obiecujących podejść.

Teraz mam trzy pytania (nie krępuj się odpowiedzieć tylko na pojedyncze):

  1. Czy istnieją inne solidne metody korelacji, które mógłbym / powinienem uwzględnić?
  2. Jakie solidne techniki korelacji są rzeczywiście stosowane w twojej dziedzinie? (Mówiąc o badaniach psychologicznych: Z wyjątkiem Spearmana , nigdy nie widziałem żadnej solidnej techniki korelacji poza dokumentem technicznym. Bootstrapowanie staje się coraz bardziej popularne, ale inne solidne statystyki do tej pory nie istniały).ρ
  3. Czy znasz już systematyczne porównania wielu technik korelacji?

Skomentuj również listę metod podanych powyżej.


[1] Wilcox, RR (1994). Procentowy współczynnik korelacji zgięcia. Psychometrika , 59, 601–616.

Felix S.
źródło

Odpowiedzi:

3

Z perspektywy psychologii wydaje się, że korelacja Pearsona i Spearmana jest najczęstsza. Myślę jednak, że wielu badaczy psychologii przeprowadza różne procedury manipulacji danymi na zmiennych składowych przed wykonaniem korelacji Pearsona. Wyobrażam sobie, że każde badanie odporności powinno uwzględniać skutki:

  • transformacje jednej lub obu zmiennych, aby zmienne były zbliżone do rozkładu normalnego
  • korekta lub usunięcie wartości odstających w oparciu o regułę statystyczną lub znajomość problemów z obserwacją
Jeromy Anglim
źródło
1

Poleciłbym wam ten znakomity artykuł opublikowany w Science w 2011 roku, który wcześniej tu zamieściłem . Zaproponowano jeden nowy solidny środek wraz z wyczerpującym i doskonałym porównaniem z innymi. Ponadto wszystkie środki są testowane pod kątem niezawodności. Należy zauważyć, że ta nowa miara może również identyfikować więcej niż jedną relację funkcjonalną w danych, a także identyfikować relacje niefunkcjonalne.

Miroslav Sabo
źródło
Świetny! Przyjrzę się temu bardzo uważnie. Wygląda bardzo obiecująco ...
Felix S
1
Czy możesz podać nazwę artykułu? Wygląda na to, że zniknął!
Creatron
2
Wykrywanie nowych skojarzeń w dużych zbiorach danych
Miroslav Sabo,
6
Ten artykuł spotkał się z dużą krytyką. Wydaje się, że jest przesadzony. Wiele mediów i PR działa, ale wydaje się, że zawodzi w przypadku trywialnych przykładów takich jak ▄▀, które rozpoznaje jako „liniowe”. IIRC ich badanie również nie było uczciwe, ponieważ w swoich metodach stosowali szeregi; ale w porównaniu do korelacji Pearsona zamiast spearmana.
Anony-Mus-Przywróć Monikę
8
W szczególności, patrz okoliczności faktyczne tego podejścia pod adresem: statweb.stanford.edu/~tibs/reshef/comment.pdf , ie.technion.ac.il/~gorfinm/files/science6.pdf , arxiv.org/abs/1301.7745v1
metaperture
1

Tau Kendalla jest bardzo szeroko stosowane w teorii kopuły, prawdopodobnie dlatego, że jest to bardzo naturalna rzecz do rozważenia w przypadku kopuł archimedesowych. Wykresy skumulowanego tau Kendalla zostały wprowadzone przez Genest i Rivest jako sposób wyboru modelu spośród rodzin kopuł dwuwymiarowych.

Link do artykułu Genest Rivest (1993)

Flądrarz
źródło
1

Niektóre solidne miary korelacji to:

  1. Współczynnik korelacji rang Spearmana

  2. Współczynnik korelacji Signum (Blomqvist)

  3. Tau Kendalla

  4. Absolutny współczynnik korelacji Bradleya

  5. Współczynnik korelacji Szewlyakowa

Bibliografia:

• Blomqvist, N. (1950) „O mierniku zależności między dwiema zmiennymi losowymi”, Annals of Mathematical Statistics, 21 (4): 593-600. • Bradley, C. (1985) „The Absolute Correlation”, The Mathematical Gazette, 69 (447): 12-17. • Shevlyakov, GL (1997) „O solidnym oszacowaniu współczynnika korelacji”, Journal of Mathematical Sciences, 83 (3): 434–438. • Spearman, C. (1904) „Dowód i pomiar związku między dwiema rzeczami”, American Journal of Psychology, 15: 88-93.

Sudhanshu K Mishra
źródło