Nadzorowane uczenie się z niepewnymi danymi?

11

Czy istnieje istniejąca metodologia stosowania nadzorowanego modelu uczenia się do niepewnego zestawu danych? Załóżmy na przykład, że mamy zestaw danych z klasami A i B:

+----------+----------+-------+-----------+
| FeatureA | FeatureB | Label | Certainty |
+----------+----------+-------+-----------+
|        2 |        3 | A     | 50%       |
|        3 |        1 | B     | 80%       |
|        1 |        1 | A     | 100%      |
+----------+----------+-------+-----------+

Jak moglibyśmy szkolić w tym zakresie model uczenia maszynowego? Dzięki.

machine-learning supervised-learning hyperdo
źródło

11

Jako wartość liczbową, którą przypisujesz swoim danym, myślę, że ta „pewność” z pewnością mogłaby zostać wykorzystana jako waga. Wyższe wyniki „pewności” zwiększają wagę danych na funkcji decyzyjnej, co ma sens.

Wiele nadzorowanych algorytmów uczenia obsługuje wagi, więc musisz tylko znaleźć ważoną wersję tego, którego zamierzasz używać.

Firebug
źródło

2

(+1) A ponieważ zasadniczo wagi będą miały tendencję do działania jako „repliki” punktów, prawdopodobnie każdy algorytm mógłby zostać zakodowany w wersji ważonej w ten sposób, np. W przykładzie OP, przekazać [5,8,10] kopii 3 punkty, odzwierciedlając ich pewność [50,80 100]%. (Nigdy nie powinno to być naprawdę potrzebne, ponieważ można by to zrobić w zasadzie, powinna istnieć odpowiednia ważona wersja algorytmu.)

GeoMatt22

5

Zamiast mieć etykiety A lub B, możesz zastąpić je ciągłymi wartościami pewności - na przykład odpowiada czemuś, co na pewno jest $1$ $A$ , odpowiada czemu masz pewność, że a odpowiada czemuś „re 40% pewny jest . Następnie przygotuj model, który zamiast przewidywać, że klasa lub generuje wynik od do na podstawie tego, jak myślisz, że to jedno lub drugie (i próg tego wyniku na podstawie, czy jego> lub <1/2). Sprawia to, że problem z klasyfikacją staje się problemem regresyjnym (który progujesz, aby wrócić do klasyfikatora). $0$ $B$ $0.6$ $A$ $A$ $B$ $0$ $1$

jako(gdziejest pewnością powyżej). Następnie, gdy chcesz przetestować niektóre dane, podłącz je do modelu i wydrukuj etykietę $\log \frac{p(A|x)}{p(B|x)} = \log \frac{p(A|x)}{1-P(A|x)}$ $\beta_0 + \beta_1^T x$ $p(A|x)$ $A$ $\beta_0 + \beta_1^T x >0$ $B$

Ordynans
źródło

Więc jeśli miałeś problem z klasyfikacją wielu klas, możesz ustawić swoje cele jako wektory o długości równej liczbie klas?

hyperdo

Liczba klas -1, przy założeniu, że suma pewności wynosi 100%; przykład jest podobny do regresji logistycznej. Wielu klasyfikatorów wytwarza wyniki (np. Oszacowania p (dane klasy | dane) w ramach niektórych modeli). Cała ta odpowiedź sugeruje, że zamiast bezpośredniego przewidywania klas, patrz pewności jako wyniki i zamiast tego przewiduj. Następnie zrób coś z wynikami.

Batman

Nadzorowane uczenie się z niepewnymi danymi?

Odpowiedzi: