Jaki jest najnowszy wynik w zakresie złożoności zapytań dotyczących prawidłowych formuł uczenia się PAC 2-DNF z przykładowymi zapytaniami i w jednolitym rozkładzie ? A może jakieś nietrywialne ograniczenia?
Ponieważ w ogóle nie znam teorii uczenia się, a to pytanie jest motywowane inną dziedziną, odpowiedź może być oczywista. Sprawdziłem książkę Kearnsa i Vazirani, ale wydaje się, że nie biorą pod uwagę tego ustawienia.
aktualiz. Chociaż głównym parametrem będącym przedmiotem zainteresowania jest złożoność zapytań, ważny jest również czas działania. Jeśli to możliwe, czas pracy powinien najlepiej być mniej więcej taki sam jak złożoność zapytań lub co najwyżej wielomian.
aktualiz. Dodatek B (góra strony 18) artykułu „Uczenie się funkcji podmodularnych” autorstwa Balcana i Harveya wspomina, że „dobrze wiadomo, że 2-DNF skutecznie można nauczyć się PAC”. Nie wspominają jednak o tym, czy ten wynik służy poprawnemu uczeniu się, czy zawierają jakieś odniesienia.
źródło
Odpowiedzi:
Nie wiem, czy uznasz to za nietrywialne podejście, ale proszę bardzo.
Po pierwsze, aby było jasne, abyśmy się nie mylilic -DNF z k -term DNF (co często robię), an c Formuła -DNF nad zmiennymi x1,…,xn ma formę ∨ki=1(ℓi,1∧ℓi,2...ℓi,c) gdzie ∀1≤i≤k i 1≤j≤c , ℓi,j∈{x1,…,xn,x¯1,…,x¯n} .
Możemy najpierw zapytać, ile różnych terminów może istnieć wc -DNF. Każdy termin będzie miałc z n zmienne, każda zanegowana lub nie - co dla różnych możliwych terminów. W instancji 2-DNF każdy termin pojawi się albo nie, co oznacza możliwe „cele”, gdzie to przestrzeń hipotez.2c(nc) |H|=22c(nc) H
Wyobraź sobie algorytm, który pobiera próbek, a następnie wypróbowuje wszystkiehipotez, dopóki nie znajdzie takiej, która doskonale przewiduje na próbkach. Twierdzenie Brzytwy Ockhama mówi, że wystarczy pobrać około próbek, aby znaleźć algorytm cel z błędemm |H| m=O(1ϵ|(H|+1δ) ≤ ϵ z prawdopodobieństwem .≥ 1 - δ
W tym przypadku, dla , , co oznacza, że będziesz potrzebowaćc = 2 lg| H | =O(n2)) n2) próbek do (właściwego) uczenia się.
Ale cała gra w uczeniu się nie jest tak naprawdę próbką złożoności (choć jest to część gry, szczególnie w uczeniu się wydajnym atrybutami), ale raczej w próbie zaprojektowania algorytmów czasu wielomianowego. Jeśli nie zależy ci na wydajności, ton2) jest najprostszą odpowiedzią na złożoność próbki PAC.
AKTUALIZACJA (ze względu na zmienione pytanie) :
Ponieważ wyraźnie stwierdziłeś, że zależy Ci tylko na złożoności próbki, przedstawiłem algorytm Occam Brute-Force, który jest prawdopodobnie najprostszym argumentem. Jednak moja odpowiedź była nieco nieśmiała. -DNF są faktycznie możliwe do nauczenia się w czasie wielomianowym! Jest to wynik oryginalnej pracy Valianta „ A Theory of the Learnable ”. W rzeczywistości -DNF można się nauczyć dla dowolnego .2) do c = O ( 1 )
Argument jest następujący. Możesz zobaczyć -DNF jako rozłączenie „meta-zmiennych” i spróbować nauczyć się tego rozłączenia, eliminując meta-zmienne niezgodne z przykładami. Takie rozwiązanie można łatwo przetłumaczyć z powrotem na „właściwe” rozwiązanie i zajmuje czasu. Na marginesie, wciąż pozostaje otwarte, czy istnieje algorytm czasu wielomianowego dlado ≈ndo O (ndo) c = ω ( 1 ) .
Jeśli chodzi o to, czy złożoność próbki jest również dolną granicą, odpowiedź jest prawie tak. Ten artykuł autorstwa Ehrenfeucht i in. pokazuje, że granica Occam jest prawie ciasna.n2)
źródło