Próbuję nauczyć się języka Python i Sklearn, ale do mojej pracy muszę uruchomić regresje, które wykorzystują rozkłady błędów z rodzin Poissona, Gammy, a zwłaszcza Tweediego.
Nie widzę nic w dokumentacji na ich temat, ale są one w kilku częściach dystrybucji R, więc zastanawiałem się, czy ktoś widział gdzieś implementacje dla Pythona. Byłoby bardzo fajnie, gdybyś mógł skierować mnie w stronę implementacji SGD dystrybucji Tweedie!
Odpowiedzi:
Istnieje ruch w celu wdrożenia uogólnionych modeli liniowych z rozkładami błędów Poissona, gamma i Tweediego w scikit-learn.
Statsmodels ma implementacje uogólnionych modeli liniowych z rozkładami błędów Poissona, Tweediego i gamma.
Podczas aktualizacji tej odpowiedzi Spark ML (eksperymentalnie) obsługuje również dystrybucje Poissona, Tweediego i gamma.
źródło
H2O ma uogólniony model liniowy .
Używają jednak ramek H2O, więc nie można bezpośrednio używać Pandas / Numpy.
źródło