Pakiety Python do pracy z modelami mieszanin Gaussa (GMM)

12

Wydaje się, że istnieje kilka opcji pracy z modelami mieszanki Gaussa (GMM) w Pythonie. Na pierwszy rzut oka są co najmniej:

... a może inni. Wszystkie wydają się zaspokajać najbardziej podstawowe potrzeby GMM, w tym tworzenie i próbkowanie, szacowanie parametrów, grupowanie itp.

Jaka jest różnica między nimi i jak należy zdecydować, który najlepiej pasuje do konkretnej potrzeby?

Patrz: http://www.scipy.org/Topical_Software

Mężczyzna
źródło
Możesz spróbować profilować naprawdę prostą wersję kompresji obrazu za pomocą GMM. Biorąc pod uwagę obraz, użyj GMM, aby przypisać pikselom różne prawdopodobieństwa, a następnie odtworzyć obraz, używając prawdopodobieństw jako wskaźników dla konkretnego Gaussa, z którego najprawdopodobniej pochodzi dany piksel.
Phillip Cloud,
@cpcloud - Masz na myśli: skonfigurować uproszczony eksperyment do wykonania w każdym z tych pakietów, dla porównania? No dobrze, ale to niemały wysiłek. Mam nadzieję na pewne informacje od osób, które korzystały z tych pakietów.
Aman
2
Scikit-learn to popularna biblioteka do uczenia maszynowego, która również obsługuje GMM. Nie jestem pewien, czy pasuje do twoich potrzeb, ale ma tę zaletę, że ma inne algorytmy uczenia się i strukturę (np. Walidacja krzyżowa, skład modelu).
Bitowe
PyPR i PyEM są dostępne tylko dla Python 2 i nie wydają się być w trakcie aktywnego rozwoju. PyMix wygląda na najlepszy wybór.
Josh Milthorpe,

Odpowiedzi:

3

Nie wiem, jak ogólnie określić, która z nich jest najlepsza, ale jeśli znasz wystarczająco ustawienia aplikacji, możesz symulować dane i wypróbować pakiety na tej symulacji. Miarami sukcesu może być czas, jaki zajmuje oszacowanie i jakość odzyskania symulowanej prawdy gruntu.

Gael Varoquaux
źródło