Załóżmy, że buduję model predykcyjny, w którym próbuję przewidzieć wiele zdarzeń (na przykład zarówno rzut kości, jak i rzut monetą). Większość znanych mi algorytmów działa tylko z jednym celem, więc zastanawiam się, czy istnieje standardowe podejście do tego rodzaju rzeczy.
Widzę dwie możliwe opcje. Być może najbardziej naiwnym podejściem byłoby po prostu potraktowanie ich jako dwóch różnych problemów, a następnie połączenie wyników. Ma to jednak poważne wady, gdy dwa cele nie są niezależne (w wielu przypadkach mogą być bardzo zależne).
Bardziej rozsądnym podejściem byłoby dla mnie połączenie atrybutu celu. Zatem w przypadku kości i monety mielibyśmy stanów ( itd.). Może to jednak prowadzić do tego, że liczba stanów / klas w złożonym celu będzie dość szybko dość duża (co gdybyśmy mieli 2 kości itp.). Co więcej, wydaje się to dziwne w przypadku, gdy jeden atrybut jest kategoryczny, a drugi liczbowy (na przykład w przypadku przewidywania temperatury i rodzaju opadów).( 1 , H ) , ( 1 , T ) , ( 2 , H )
Czy istnieje jakieś standardowe podejście do tego rodzaju rzeczy? Alternatywnie, czy istnieją jakieś algorytmy uczenia zaprojektowane specjalnie do tego?
źródło
Odpowiedzi:
W społeczności Machine Learning jest to znane jako „uczenie się wielu etykiet”. Istnieją różne podejścia do problemu, w tym te, które opisujesz w swoim pytaniu. Niektóre zasoby na początek:
źródło
Jeśli masz dwie zmienne z tymi samymi predyktorami, a zmienna B ma również zmienną A jako predyktor, prawdopodobnie patrzysz na problem optymalizacji, w którym chcesz zoptymalizować szacunki A i B jednocześnie. Optymalizacja jednego z nich nie ma sensu, jeśli w takim przypadku otrzymujesz złe oszacowanie drugiego.
Byłby to problem z badaniami operacyjnymi i niestety poza moim zakresem wiedzy.
źródło