Niedawno przeczytałem książkę Skillicorn o rozkładach matryc i byłem nieco rozczarowany, ponieważ był skierowany do słuchaczy. Chciałbym skompilować (dla siebie i innych) krótką bibliografię podstawowych artykułów (ankiety, ale także artykuły przełomowe) na temat rozkładu macierzy. Mam przede wszystkim na myśli SVD / PCA (i mocne / rzadkie warianty) i NNMF, ponieważ są one najczęściej używane. Czy wszyscy macie jakieś rekomendacje / sugestie? Powstrzymuję moje, by nie stronić od odpowiedzi. Prosiłbym o ograniczenie każdej odpowiedzi do 2-3 artykułów.
PS: Te dwa dekompozycje nazywam najczęściej stosowanymi w analizie danych . Oczywiście QR, Cholesky, LU i polar są bardzo ważne w analizie numerycznej. Nie na tym jednak koncentruje się moje pytanie.
źródło
Dla NNMF Lee i Seung opisują iteracyjny algorytm, który jest bardzo prosty do wdrożenia. W rzeczywistości dają dwa podobne algorytmy, jeden do minimalizacji normy resztkowej Frobeniusa, drugi do minimalizacji Rozbieżności Kullbacka-Leiblera aproksymacji i macierzy oryginalnej.
źródło
Może znajdziesz interesujące
Dwa ostatnie łącza pokazują, w jaki sposób rzadkie faktoryzacje macierzy są używane w filtrowaniu grupowym. Uważam jednak, że algorytmy faktoryzacji podobne do SGD mogą być przydatne gdzie indziej (przynajmniej są wyjątkowo łatwe do kodowania)
źródło
Witten, Tibshirani - Karany rozkład macierzy
http://www.biostat.washington.edu/~dwitten/Papers/pmd.pdf
http://cran.r-project.org/web/packages/PMA/index.html
Martinsson, Rokhlin, Szlam, Tygert - Randomized SVD
http://cims.nyu.edu/~tygert/software.html
http://cims.nyu.edu/~tygert/blanczos.pdf
źródło
Na tegorocznych targach NIPS ukazał się krótki artykuł na temat rozproszonego SVD na dużą skalę, który działa w jednym przejściu przez macierz przesyłania strumieniowego .
Dokument jest bardziej zorientowany na implementację, ale przedstawia rzeczy z perspektywy czasu rzeczywistego i zegara na ścianie. Tabela na początku jest również dobrą ankietą.
źródło