Jaka jest różnica między zwykłym PCA a probabilistycznym PCA?

15

Wiem, że zwykłe PCA nie stosuje probabilistycznego modelu obserwowanych danych. Jaka jest więc podstawowa różnica między PCA a PPCA ? W modelu PPCA utajona zmienna zawiera na przykład zmienne obserwowane , utajone (zmienne nieobserwowane x ) i macierz W , która nie musi być ortonormalna jak w zwykłym PCA. Jeszcze jedna różnica, którą mogę pomyśleć o zwykłym PCA, zapewnia tylko główne składniki, przy czym PPCA zapewnia rozkład prawdopodobieństwa danych.yxW

Czy ktoś mógłby lepiej zrozumieć różnice między PCA i PPCA?

Wendeta
źródło
2
Zobacz tutaj .
Ami Tavory
1
+1. Zobacz moje odpowiedzi tutaj stats.stackexchange.com/questions/208731, a także tutaj stats.stackexchange.com/questions/203087 . Czy czytałeś slajdy, z którymi się łączyłeś? Wydają się wyjaśniać wszystko szczegółowo. Czy możesz śledzić tę ekspozycję, czy jest to zbyt skomplikowane?
ameba mówi Przywróć Monikę
@amoeba, śledziłem slajdy, mam pewne różnice, jednak nie daje mi to jasnej intuicji, że co PPCA może zrobić, czego PCA nie może zrobić? Co dzieje się technicznie poprzez wprowadzenie ukrytych zmiennych? Oszacowanie kowariancji jak w przypadku PPCA można również przeprowadzić w zwykłym PCA? Jeśli możesz dodać odpowiedź, byłoby to naprawdę pomocne
Vendetta
@amoeba, na te dwa pytania dość dobrze odpowiedziano. W szczególności pytanie o główną podprzestrzeń w probabilistycznym PCA. To daje mi więcej intuicji w zrozumieniu oszacowania głównych składników z W.
Vendetta
OK, postaram się opublikować odpowiedź, ale w dzisiejszych czasach jestem dość zajęty. Spróbuję znaleźć czas w tym tygodniu, ale mogę go przełożyć na następny tydzień. (Przy okazji +1)
ameba mówi Przywróć Monikę

Odpowiedzi:

9

Celem PPCA nie jest zapewnienie lepszych wyników niż PCA, ale umożliwienie szerokiego zakresu przyszłych rozszerzeń i analiz. W artykule wyraźnie wymieniono niektóre zalety wprowadzenia, tj. / Np .:

„definicja miary prawdopodobieństwa umożliwia porównanie z innymi technikami probabilistycznymi, jednocześnie ułatwiając testy statystyczne i pozwalając na zastosowanie modeli bayesowskich”.

Szczególnie modele bayesowskie przeżywają ostatnio ogromny renesans, np. VAE, „automatyczne kodowanie wariacyjne Bayesa”, https://arxiv.org/abs/1312.6114 . Przedłużenie PCA do wykorzystania w ramach wariacyjnych i podobnych może potencjalnie pozwolić innemu badaczowi powiedzieć „Och, hej, co jeśli zrobię…?”

Hugh Perkins
źródło