Załóżmy, jest wektorem, który maksymalizuje odchylenie występu danych z matrycy projektu .X
Teraz widziałem materiały, które określają jako (pierwszy) główny składnik danych, który jest również wektorem własnym o największej wartości własnej.
Widziałem jednak również, że głównym składnikiem danych jest .
Oczywiście i to różne rzeczy. Czy ktoś może mi pomóc tutaj i powiedzieć, jaka jest różnica między tymi dwiema definicjami głównych składników?X u
pca
terminology
definition
Nazywam się Jeff
źródło
źródło
Odpowiedzi:
Nie ma absolutnej słusznie zauważyć, że mimo iż (jeden z wektorów własnych macierzy kowariancji np pierwszy) i X u (rzutowanie danych na podprzestrzeni 1-wymiarowego objętej przez U ) to dwa różne miejsca, mająca często nazywane są „głównym składnikiem”, czasem nawet w tym samym tekście.u Xu u
Podsumowanie dwóch konwencji:
Uwaga: Tylko wektory własne macierzy kowariancji odpowiadające niezerowym wartościom własnym można nazwać głównymi kierunkami / składnikami. Jeśli macierz kowariancji ma niską rangę, będzie miała jedną lub więcej zerowych wartości własnych; odpowiadające wektory własne (i odpowiadające im rzuty, które są stałe zero) nie powinny być nazywane głównymi kierunkami / składnikami. Zobacz dyskusję w mojej odpowiedzi tutaj.
źródło