Losowy las (RF) jest tworzony przez zespół drzew decyzyjnych (DT). Korzystając z workowania, każdy ID jest trenowany w innym podzbiorze danych. Czy zatem istnieje jakiś sposób na wdrożenie losowego lasu on-line poprzez dodanie większej liczby decyzji dotyczących nowych danych?
Na przykład mamy próbki 10K i trenujemy 10 DT. Następnie otrzymujemy próbki 1K i zamiast ponownie trenować pełne RF, dodajemy nowy ID. Prognozy są teraz wykonywane przez średnią bayesowską 10 + 1 DT.
Ponadto, jeśli zachowamy wszystkie poprzednie dane, nowe ID można trenować głównie w zakresie nowych danych, w których prawdopodobieństwo pobrania próbki jest ważone w zależności od tego, ile razy już pobrano.
źródło