Niech będzie rozkładem na pary łańcuchów bitów / etykiet { 0 , 1 } d × { 0 , 1 } i niech C będzie zbiorem funkcji o wartościach logicznych f : { 0 , 1 } d → { 0 , 1 } . Dla każdej funkcji f ∈ C , niech: e r r ( f , D ) = Pr ( x , y ) i niech: OPT(C,D)= min f ∈ C err(f,D) Powiedz, że algorytmAagnostycznie uczy sięCna dowolnym rozkładzie, jeśli dla dowolnegoDmoże ona z prawdopodobieństwem2/3znajduje się funkcjafw taki sposób,eRR(f,
, biorąc pod uwagę czas i liczbę próbek z D, które są ograniczone wielomianem id oraz 1 / ϵ .
Pytanie: Jakie klasy funkcji są znane z agnostycznego uczenia się w dowolnych rozkładach?
Żadna klasa nie jest zbyt prosta! Wiem, że nawet monotoniczne sprzężenia nie są znane z agnostycznego uczenia się w dowolnych rozkładach, więc szukam po prostu nietrywialnych klas funkcji.
reference-request
machine-learning
lg.learning
Aaron Roth
źródło
źródło
Odpowiedzi:
Jeśli żadna klasa nie jest zbyt prosta, oto niektóre agnostycznie możliwe do nauczenia klasy PAC. W odpowiedzi na komentarze przekreślono klasy o wielomianowo wielu hipotezach:
drzewa decyzyjne o stałej głębokości (i inne klasy mające tylko wiele hipotez)inne klasy hipotez w warunkach niskiego wymiaru.Prawie wszystko inne jest trudne do (przynajmniej właściwie) agnostycznie nauki PAC.
Samouczek Adama Kalai na temat nauki agnostycznej może Cię również zainteresować.
źródło