Kanoniczna analiza korelacji z korelacją rang

15

Kanoniczna analiza korelacji (CCA) ma na celu maksymalizację zwykłej korelacji iloczynu Pearsona z momentem produktu (tj. Współczynnik korelacji liniowej) kombinacji liniowych dwóch zestawów danych.

Rozważmy teraz fakt, że ten współczynnik korelacji mierzy tylko asocjacje liniowe - właśnie dlatego używamy na przykład współczynników korelacji Spearmana- lub Kendall- τ (ranga), które mierzą dowolne monotoniczne (niekoniecznie liniowe) połączenie między zmienne.ρτ

Dlatego myślałem o następujących kwestiach: jednym ograniczeniem CCA jest to, że próbuje on uchwycić jedynie liniowe powiązanie między utworzonymi kombinacjami liniowymi ze względu na swoją funkcję celu. Nie byłoby możliwe rozszerzenie CCA w pewnym sensie poprzez maksymalizację, powiedzmy, Spearman- zamiast Pearson- r ?ρr

Czy taka procedura doprowadziłaby do czegoś statystycznie interpretowalnego i sensownego? (Czy ma sens - na przykład - przeprowadzanie CCA w szeregach ...?) Zastanawiam się, czy pomogłoby to, gdy mamy do czynienia z niestandardowymi danymi ...

Tamas Ferenci
źródło
4
Czy OVERALS - liniowa analiza kanoniczna, która optymalnie skaluje (monotonicznie przekształca) zmienne w celu maksymalizacji korelacji kanonicznych - przypadnie Ci do gustu?
ttnphns
@ttnphns: Dzięki za pomysł, nie słyszałem o nim wcześniej i wygląda naprawdę interesująco! Nie sądzę jednak, aby odnosiło się to do sedna: o ile rozumiem, jest to zasadniczo kombinacja optymalnego skalowania i CCA - ale optymalne skalowanie ma sens tylko w przypadku zmiennych kategorialnych. Wydaje się, że niewiele się zmienia w przypadku zmiennych ciągłych mierzonych w skali proporcji (co mam na myśli!). Ale popraw mnie, jeśli się mylę.
Tamas Ferenci
1
@ttnphns: Cóż, w ten sam sposób, w jaki czasami używasz korelacji Spearmana na zmiennych ciągłych! (Oczywiście obsługuje dane jako porządkowe ... ale nigdy nie używamy ich na definitywnie ciągłych zmiennych, aby scharakteryzować ogólny monotoniczny (a nie tylko liniowy) związek między zmiennymi.) Dlatego pomyślałem, że to ma sens również w CCA ...
Tamas Ferenci,
@Glen_b, masz rację. Oczywiście korelacje rang dotyczą dowolnej monotoniczności - czy to danych porządkowych, czy ciągłych. Jestem tak zaskoczony moim komentarzem powyżej, że go usuwam.
ttnphns
Możesz spróbować użyć Kernela CCA, który w szczególności w połączeniu z radialnymi funkcjami podstawowymi umożliwia nam rzutowanie danych do nieskończonej przestrzeni wymiarowej.
roni

Odpowiedzi:

6

Użyłem ograniczonych rozszerzeń splajnu sześciennego podczas obliczania zmiennych kanonicznych. Dodajesz nieliniowe funkcje bazowe do analizy dokładnie tak, jak dodawałbyś nowe funkcje. Powoduje to nieliniową analizę głównego składnika. Patrz R. Hmiscpakiet „S transcanfunkcję przykład. homalsPakiet R idzie o wiele dalej.

Frank Harrell
źródło
1
Dziękuję Ci! Podejście opisane w homalsach było dla mnie nowe, ale zdecydowanie interesujące.
Tamas Ferenci
4

Standardowa metoda CCA działa z macierzą współczynnika korelacji momentu produktu. Dla największej mgnitude CC konstruuje dwie zmienne złożone z1 (n) i z2 (n) poprzez liniową kombinację dwóch macierzy (z n rzędami i zmiennymi m1 i m2) tak, że abs (korelacja (z1, z2)) jest zmaksymalizowana. Tę funkcję celu można zmaksymalizować bezpośrednio, nawet jeśli korelacja (z1, z2) nie jest momentem iloczynowym, ale jest zdefiniowana inaczej.

Mishra, SK (2009) „Nota o porządkowej analizie kanonicznej korelacji dwóch zestawów wyników rankingu”

http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1328319

SK Mishra
źródło