Wiem, jak obliczyć PCA i SVD matematycznie, i wiem, że oba można zastosować do regresji liniowej najmniejszych kwadratów.
Główną zaletą SVD matematycznie wydaje się być to, że można ją zastosować do macierzy niekwadratowych.
Oba skupiają się na rozkładzie macierzyPoza wymienioną przewagą SVD, czy istnieją jakieś dodatkowe zalety lub spostrzeżenia zapewniane przez użycie SVD w porównaniu z PCA?
Naprawdę szukam intuicji, a nie jakichkolwiek różnic matematycznych.
pca
least-squares
svd
Baz
źródło
źródło
advantage... SVD over PCA
- svd i PCA nie mogą być porównywane jako operacja matematyczna i metoda analizy danych. Czy twoje pytanie może dotyczyć sposobów wykonywania PCA ? Albo o co pytaszOdpowiedzi:
Jak powiedzieli @ttnphns i @ nick-cox, SVD jest metodą numeryczną, a PCA jest metodą analizy (jak najmniejszych kwadratów). Możesz wykonać PCA za pomocą SVD, lub PCA wykonując rozkład własny (lub ), lub możesz wykonać PCA za pomocą wielu innych metod, tak jak możesz rozwiązać najmniejsze kwadraty za pomocą kilkunastu różnych algorytmów jak metoda Newtona, spadek gradientu lub SVD itp.X X T.XTX XXT
Tak więc nie ma „przewagi” SVD nad PCA, ponieważ jest to jak pytanie, czy metoda Newtona jest lepsza od najmniejszych kwadratów: te dwa nie są porównywalne.
źródło
Pytanie naprawdę nasuwa pytanie, czy przed zastosowaniem SVD należy wykonać normalizację kolumn Z-score. Wynika to z powyższej transformacji PCA, po której następuje SVD. Czasami normalizacja jest dość szkodliwa. Jeśli twoje dane są na przykład (przekształcone) liczbą słów, które są dodatnie, odjęcie średniej jest zdecydowanie szkodliwe. Jest tak, ponieważ zera reprezentujące brak słowa w dokumencie zostaną zmapowane na liczby ujemne o dużej wielkości. W przypadku problemów liniowych należy zastosować wyższą wartość do przedstawienia zakresu, w którym cechy są najbardziej wrażliwe. Również dzielenie przez odchylenie standardowe jest szkodliwe dla tego typu danych.
źródło