Mam zestaw danych składający się z 10 zmiennych. Uruchomiłem częściowe najmniejsze kwadraty (PLS), aby przewidzieć pojedynczą zmienną odpowiedzi na podstawie tych 10 zmiennych, wyodrębniłem 10 składników PLS, a następnie obliczyłem wariancję każdego składnika. Na podstawie oryginalnych danych wziąłem sumę wariancji wszystkich zmiennych, która wynosi 702.
Następnie podzieliłem wariancję każdego ze składników PLS przez tę sumę, aby uzyskać procent wariancji wyjaśniony przez PLS, i nieoczekiwanie wszystkie składniki razem wyjaśniają tylko 44% pierwotnej wariancji.
Jakie jest tego wytłumaczenie? Czy nie powinno to być 100%?
Odpowiedzi:
Suma wariancji wszystkich składników PLS jest zwykle mniejsza niż 100%.
Istnieje wiele wariantów częściowych najmniejszych kwadratów (PLS). Zastosowano tutaj regresję PLS zmiennej odpowiedzi jednowymiarowej na kilka zmiennych X ; algorytm ten jest tradycyjnie znany jako PLS1 (w przeciwieństwie do innych wariantów, zobacz zwięzłe omówienie , patrz Rosipal i Kramer, 2006, Przegląd i Najnowsze postępy w częściowych najmniejszych kwadratach ). Później wykazano, że PLS1 odpowiada bardziej eleganckiemu sformułowaniu o nazwie SIMPLS (patrz odniesienie do płatnego Jong 1988 w Rosipal i Kramer). Widok zapewniony przez SIMPLS pomaga zrozumieć, co się dzieje w PLS1.y X
Okazuje się, że to, co robi PLS1, polega na znalezieniu sekwencji rzutów liniowych , tak aby:tja= X wja
Zauważ, że wektory wagi nie muszą być (i nie są) ortogonalne.
Nie znam żadnego podręcznika ani artykułu, który wyraźnie omawiałby ten problem, ale wcześniej wyjaśniłem go w kontekście liniowej analizy dyskryminacyjnej (LDA), która daje również szereg nieskorelowanych rzutów na nieortogonalne wektory masy jednostkowej, patrz tutaj : Odsetek wyjaśnionej wariancji w PCA i LDA .
źródło
PCTVAR
(procent wariancji wyjaśniona w X) nie zgadza się z twoimi obliczeniami? A może pytasz o drugą kolumnę (procent wariancji wyjaśniony w y)? Ogólnie rzecz biorąc, jeśli chcesz zająć się matematyką PLS, sugeruję, abyś zaczął czytać artykuł Rosipala i Kramera i podążał za linkami.