Kiedy stosować model mieszanki Gaussa?

9

Jestem nowy w korzystaniu z GMM. Nie udało mi się znaleźć odpowiedniej pomocy online. Czy ktoś mógłby podać mi odpowiednie informacje na temat „Jak zdecydować, czy używanie GMM pasuje do mojego problemu?” lub w przypadku problemów z klasyfikacją „Jak zdecydować, czy muszę użyć klasyfikacji SVM czy GMM?”

Vinay
źródło
jaki jest twój zestaw danych i jaki jest twój dokładny problem? Jest używany, gdy dane następują (są mieszanką) więcej niż 1 rozkład normalny. Zobacz kolejne pytanie - stats.stackexchange.com/questions/236295/...
Arpit Sisodia
Możesz myśleć o tym jako o klastrze, w którym nie masz oznaczonych danych i uważasz, że utajone grupowanie jest normalne na wielu odmianach.
Gung - Przywróć Monikę
@ arpit-sisodia, Pracujemy nad wykonalnością konfiguracji klawiatury sprzętowej, która wydaje się mieć określone funkcje, i planujemy modelować ją za pomocą GMM. Nie znamy jasno procesu leżącego u jego podstaw, dlatego staramy się modelować przy użyciu metod uczenia maszynowego. Nie jesteśmy więc pewni, czy w procesie leżącym u podstaw leży mieszanka gaussów. Co więcej, jest wielowymiarowy i nie możemy go wizualizować, aby zobaczyć, czy jest to mieszanka gaussów
Vinay
@ arpit-sisodia, podany przez Ciebie link sugeruje więcej metod prób i błędów, aby sprawdzić, czy GMM pasuje do moich danych. Czy istnieje rozstrzygający sposób / Reguła kciuka, aby zdecydować, które modele będą używane. Metoda prób i błędów polegająca na graniu większą ilością mieszanek może pasować do moich danych. Ale czy jest jakiś sposób na podjęcie decyzji? Tak jak potrzebujemy liniowej separowalności danych do klasyfikacji SVM
Vinay

Odpowiedzi:

4

Moim zdaniem możesz wykonać GMM, gdy wiesz, że punkty danych są mieszankami rozkładu Gaussa. Zasadniczo tworzenie klastrów o różnych średnich i standardowych odchyleniach. Na stronie scikit-learn znajduje się ładny schemat. L.

Klasyfikacja GMM

Podejście polega na znalezieniu klastrów przy użyciu metod klastrowania miękkiego, a następnie sprawdzeniu, czy są one gaussowskie. Jeśli tak, możesz zastosować model GMM, który reprezentuje cały zestaw danych.

pogromca
źródło
1
często nie wiemy, czy punkty danych to Mieszanina Gaussów. Tak więc jest to bardziej zabawa z Gaussianem i MoG i sprawdzenie, czy to pasuje. Ale nie ma żadnych wskazówek / zasad dotyczących korzystania z GMM w prawo
Vinay
2
Zgodnie z moim doświadczeniem musisz znaleźć wzór w danych, że jest to model mieszanki. Przyjemny artykuł do czytania to: stat.cmu.edu/~cshalizi/uADA/12/lectures/ch20.pdf
Slayer
0

GMM są zwykle dobrym miejscem do rozpoczęcia, jeśli Twoim celem jest (1) obserwacja skupień, (2) określenie modelu generatywnego lub (3) oszacowanie gęstości. W rzeczywistości w przypadku grupowania GMM są nadzbiorem średnich k-średnich.

1_e
źródło