Solidne, wielowymiarowe dopasowanie Gaussa w R.

11

Muszę dopasować uogólniony rozkład Gaussa do 7-słabej chmury punktów zawierającej dość znaczną liczbę wartości odstających o dużej dźwigni. Czy znasz jakiś dobry pakiet R dla tej pracy?

kjetil b halvorsen
źródło
3
W odpowiedziach na podobne pytanie na stats.stackexchange.com/questions/213/… znajdują się łącza do co najmniej czterech pakietów R do identyfikowania wartości odstających na wielu odmianach . To może być dobry początek.
whuber
Może pytanie mi umyka, ale jeśli chodzi o dopasowanie wielowymiarowego rozkładu Gaussa, dlaczego nie użyć po prostu średniej empirycznej i SD jako MLE? Następnie możesz skoncentrować się na statystykach diagnostycznych, jeśli istnieją wysokie punkty wpływu / dźwigni.
AdamO,

Odpowiedzi:

1

Istnieje również mclust: http://www.stat.washington.edu/research/reports/2012/tr597.pdf http://cran.r-project.org/web/packages/mclust/index.html

Jedna uwaga: modelowanie mieszanin w przestrzeni wielowymiarowej może zająć sporo procesora i pamięci, jeśli twoja chmura punktów jest duża. Jakieś cztery lata temu robiłem partię 11-wymiarowych danych punktowych o wartości 50-200K, a zmieściło się w nich 4-11 GB pamięci RAM i obliczenie każdego przypadku zajęło tydzień (i miałem 400). Jest to z pewnością możliwe, ale może być uciążliwe, jeśli używasz wspólnego klastra obliczeniowego lub masz ograniczone zasoby.

Kieran O'Neill
źródło
1

To brzmi jak klasyczny, wielowymiarowy model mieszanki Gaussa. Myślę, że pakiet BayesM może działać.

Oto kilka wielowymiarowych pakietów Mieszanki Gaussa

  • bayesm: cran.r-project.org/web/packages/bayesm/index.html
  • mixtools: www.jstatsoft.org/v32/i06/paper
EngrStudent
źródło