Czytanie Wikipedii o kanonicznej analizie korelacji (CCA) dla dwóch losowych wektorów i , Zastanawiałem się, czy odpowiedź głównego składnika (PCA) jest taka sama jak CCA, kiedy ?
9
Czytanie Wikipedii o kanonicznej analizie korelacji (CCA) dla dwóch losowych wektorów i , Zastanawiałem się, czy odpowiedź głównego składnika (PCA) jest taka sama jak CCA, kiedy ?
vectors X and Y
Czy to dwie zmienne (kolumny danych) lub dwa przypadki (wiersze); biorąc pod uwagę, że przeprowadzimy analizy zmiennych. 2)X and Y are the same
Czy chcesz powiedzieć, że X = Y lub w inny sposób?Odpowiedzi:
PozwolićX być n ×p1 i Y być n ×p2) macierze danych, reprezentujące dwa zestawy danych z n próbki (tj. obserwacje losowych wektorów wierszy X i Y ) w każdym z nich.
CCA szuka liniowej kombinacjip1 zmienne w X i liniowa kombinacja p2) zmienne w Y tak, że są maksymalnie skorelowane między sobą; następnie szuka następnej pary, pod warunkiem zerowej korelacji z pierwszą parą; itp.
W razieX = Y (i p1=p2=p ), dowolna kombinacja liniowa w jednym zbiorze danych będzie trywialnie korelowana 1 z tą samą kombinacją liniową w innym zbiorze danych. Więc wszystkie pary CCA będą miały korelacje1 , a kolejność par jest dowolna. Jedynym pozostałym ograniczeniem jest to, że kombinacje liniowe powinny być nieskorelowane między sobą. Istnieje nieskończona liczba sposobów wyborup nieskorelowane kombinacje liniowe (zauważ, że wagi nie muszą być ortogonalne wp -wymiarowa przestrzeń) i każda z nich wygeneruje prawidłowe rozwiązanie CCA. Jednym z takich sposobów jest rzeczywiście PCA, ponieważ dowolne dwa komputery mają zerową korelację.
Tak więc rozwiązanie PCA rzeczywiście będzie poprawnym rozwiązaniem CCA, ale w tym przypadku istnieje nieskończona liczba równorzędnie dobrych rozwiązań CCA.
Matematycznie CCA szuka właściwego (a ) i lewo (b ) wektory pojedyncze C−1/2XXCXYC−1/2YY , co w tym przypadku jest równe I , przy czym każdy wektor jest wektorem własnym. Więca=b może być dowolny. CCA otrzymuje następnie liniowe wagi kombinacji jakoC−1/2XXa i C−1/2YYb . W tym przypadku sprowadza się to do przyjęcia arbitralnej podstawy i przekształcenia jejC−1/2XX , które rzeczywiście wygenerują nieskorelowane kierunki .
źródło