Planuję przeprowadzić badanie symulacyjne, w którym porównuję wydajność kilku solidnych technik korelacji z różnymi rozkładami (wypaczonymi, z wartościami odstającymi itp.). Przez solidne rozumiem idealny przypadek bycia odpornym na a) wypaczone rozkłady, b) wartości odstające i c) ciężkie ogony.
Wraz z korelacją Pearsona jako punktem odniesienia, myślałem o uwzględnieniu następujących bardziej solidnych miar:
- Spearman's
- Korelacja zgięcia procentowego (Wilcox, 1994, [1])
- Elipsoida minimalnej objętości, wyznacznik minimalnej kowariancji (
cov.mve
/cov.mcd
zcor=TRUE
opcją) - Prawdopodobnie korelacja winsorized
Oczywiście istnieje wiele innych opcji (zwłaszcza jeśli uwzględnisz również solidne techniki regresji), ale chcę ograniczyć się do najczęściej używanych / najbardziej obiecujących podejść.
Teraz mam trzy pytania (nie krępuj się odpowiedzieć tylko na pojedyncze):
- Czy istnieją inne solidne metody korelacji, które mógłbym / powinienem uwzględnić?
- Jakie solidne techniki korelacji są rzeczywiście stosowane w twojej dziedzinie? (Mówiąc o badaniach psychologicznych: Z wyjątkiem Spearmana , nigdy nie widziałem żadnej solidnej techniki korelacji poza dokumentem technicznym. Bootstrapowanie staje się coraz bardziej popularne, ale inne solidne statystyki do tej pory nie istniały).
- Czy znasz już systematyczne porównania wielu technik korelacji?
Skomentuj również listę metod podanych powyżej.
[1] Wilcox, RR (1994). Procentowy współczynnik korelacji zgięcia. Psychometrika , 59, 601–616.
źródło
Tau Kendalla jest bardzo szeroko stosowane w teorii kopuły, prawdopodobnie dlatego, że jest to bardzo naturalna rzecz do rozważenia w przypadku kopuł archimedesowych. Wykresy skumulowanego tau Kendalla zostały wprowadzone przez Genest i Rivest jako sposób wyboru modelu spośród rodzin kopuł dwuwymiarowych.
Link do artykułu Genest Rivest (1993)
źródło
Niektóre solidne miary korelacji to:
Współczynnik korelacji rang Spearmana
Współczynnik korelacji Signum (Blomqvist)
Tau Kendalla
Absolutny współczynnik korelacji Bradleya
Współczynnik korelacji Szewlyakowa
Bibliografia:
• Blomqvist, N. (1950) „O mierniku zależności między dwiema zmiennymi losowymi”, Annals of Mathematical Statistics, 21 (4): 593-600. • Bradley, C. (1985) „The Absolute Correlation”, The Mathematical Gazette, 69 (447): 12-17. • Shevlyakov, GL (1997) „O solidnym oszacowaniu współczynnika korelacji”, Journal of Mathematical Sciences, 83 (3): 434–438. • Spearman, C. (1904) „Dowód i pomiar związku między dwiema rzeczami”, American Journal of Psychology, 15: 88-93.
źródło
Biocentryczna korelacja zaimplementowana w R (bardzo szybko) przez WGCNA i w Pythonie (nie tak szybko) przez astropię . To moje przejście do analizy sieci.
Dla rzadkich danych kompozycyjnych dostępne są również SparCC i FastSpar
źródło