Czy można wyszkolić losowy las, aby odpowiednio przewidywał dane zliczania? Jak by to przebiegło? Mam dość szeroki zakres wartości, więc klasyfikacja naprawdę nie ma sensu. Gdybym użył regresji, czy po prostu obciąłbym wyniki? Jestem tu całkiem zagubiony. Jakieś pomysły?
r
regression
random-forest
prediction
count-data
JEquihua
źródło
źródło
Odpowiedzi:
Istnieje pakiet R o nazwie,
mobForest
który może zmieścić prawdziwy losowy las dla danych zliczania. Opiera się namod()
(partycjonowanie rekurencyjne oparte na modelu) wparty
pakiecie. Wykonuje regresję Poissona, jeślifamily
argument jest określony jakopoisson()
. Pakiet nie znajduje się już w repozytorium CRAN, ale wcześniej dostępne wersje można uzyskać z archiwum.Jeśli nie jesteś ograniczony do losowego lasu / workowania, dostępna jest również wersja przypominająca dla danych zliczania. To znaczy
gbm
(uogólnione modele regresji wzmocnionej). Może również pasować do modelu Poissona.źródło
Widzę kilka możliwości.
źródło
Cóż, nie jest to losowy las, ale CatBoost obsługuje funkcję utraty poissona, która może być wykorzystana do regresji zliczania przy wzmocnionych drzewach:
https://tech.yandex.com/catboost/doc/dg/concepts/loss-functions-docpage/
źródło