Prawidłowa nauka PAC 2-DNF w jednolitym rozkładzie

10

Jaki jest najnowszy wynik w zakresie złożoności zapytań dotyczących prawidłowych formuł uczenia się PAC 2-DNF z przykładowymi zapytaniami i w jednolitym rozkładzie ? A może jakieś nietrywialne ograniczenia?

Ponieważ w ogóle nie znam teorii uczenia się, a to pytanie jest motywowane inną dziedziną, odpowiedź może być oczywista. Sprawdziłem książkę Kearnsa i Vazirani, ale wydaje się, że nie biorą pod uwagę tego ustawienia.

aktualiz. Chociaż głównym parametrem będącym przedmiotem zainteresowania jest złożoność zapytań, ważny jest również czas działania. Jeśli to możliwe, czas pracy powinien najlepiej być mniej więcej taki sam jak złożoność zapytań lub co najwyżej wielomian.

aktualiz. Dodatek B (góra strony 18) artykułu „Uczenie się funkcji podmodularnych” autorstwa Balcana i Harveya wspomina, że ​​„dobrze wiadomo, że 2-DNF skutecznie można nauczyć się PAC”. Nie wspominają jednak o tym, czy ten wynik służy poprawnemu uczeniu się, czy zawierają jakieś odniesienia.

Grigorij Jarosławcew
źródło
Jakie pytania?
Timothy Sun,
Tylko próbki. Wydaje mi się również, że powinienem wyraźnie powiedzieć, że pytanie dotyczy złożoności zapytań, a nie czasu działania (edytowane).
Grigorij Jarosławcew
Odpowiedziałem na twoje pytanie, zakładając, że przykładowe zapytania są tylko przypadkowymi przykładami (a nie zapytaniami członkostwa).
Lev Reyzin
1
Tak, zapytania są tylko przypadkowymi przykładami z jednolitej dystrybucji.
Grigorij Jarosławcew

Odpowiedzi:

14

Nie wiem, czy uznasz to za nietrywialne podejście, ale proszę bardzo.

Po pierwsze, aby było jasne, abyśmy się nie mylili do-DNF z k-term DNF (co często robię), an doFormuła -DNF nad zmiennymi x1,,xn ma formę ja=1k(ja,1ja,2)...ja,do) gdzie 1jak i 1jotdo, i,j{x1,,xn,x¯1,,x¯n}.

Możemy najpierw zapytać, ile różnych terminów może istnieć w c-DNF. Każdy termin będzie miałc z nzmienne, każda zanegowana lub nie - co dla różnych możliwych terminów. W instancji 2-DNF każdy termin pojawi się albo nie, co oznacza możliwe „cele”, gdzie to przestrzeń hipotez.2c(nc)|H|=22c(nc)H

Wyobraź sobie algorytm, który pobiera próbek, a następnie wypróbowuje wszystkiehipotez, dopóki nie znajdzie takiej, która doskonale przewiduje na próbkach. Twierdzenie Brzytwy Ockhama mówi, że wystarczy pobrać około próbek, aby znaleźć algorytm cel z błędemm|H|m=O(1ϵ|(H.|+1δ)ϵ z prawdopodobieństwem .1-δ

W tym przypadku, dla , , co oznacza, że ​​będziesz potrzebowaćdo=2)lg|H.|=O(n2))n2) próbek do (właściwego) uczenia się.

Ale cała gra w uczeniu się nie jest tak naprawdę próbką złożoności (choć jest to część gry, szczególnie w uczeniu się wydajnym atrybutami), ale raczej w próbie zaprojektowania algorytmów czasu wielomianowego. Jeśli nie zależy ci na wydajności, ton2) jest najprostszą odpowiedzią na złożoność próbki PAC.

AKTUALIZACJA (ze względu na zmienione pytanie) :

Ponieważ wyraźnie stwierdziłeś, że zależy Ci tylko na złożoności próbki, przedstawiłem algorytm Occam Brute-Force, który jest prawdopodobnie najprostszym argumentem. Jednak moja odpowiedź była nieco nieśmiała. -DNF są faktycznie możliwe do nauczenia się w czasie wielomianowym! Jest to wynik oryginalnej pracy Valianta „ A Theory of the Learnable ”. W rzeczywistości -DNF można się nauczyć dla dowolnego .2)dodo=O(1)

Argument jest następujący. Możesz zobaczyć -DNF jako rozłączenie „meta-zmiennych” i spróbować nauczyć się tego rozłączenia, eliminując meta-zmienne niezgodne z przykładami. Takie rozwiązanie można łatwo przetłumaczyć z powrotem na „właściwe” rozwiązanie i zajmuje czasu. Na marginesie, wciąż pozostaje otwarte, czy istnieje algorytm czasu wielomianowego dladondoO(ndo)do=ω(1) .

Jeśli chodzi o to, czy złożoność próbki jest również dolną granicą, odpowiedź jest prawie tak. Ten artykuł autorstwa Ehrenfeucht i in. pokazuje, że granica Occam jest prawie ciasna.n2)

Lew Reyzin
źródło
1
Dziękuję Ci! To nietrywialny wynik - nie zdawałem sobie sprawy, że wykładniczy czas działania będzie pomocny. Jednak w przypadku aplikacji, o której myślę, czas wielomianowy jest o wiele bardziej pożądany (zaktualizowałem pytanie). Czy podejście, które opisałeś, jest najbardziej znane z tego problemu? Czy są jakieś dolne granice złożoności zapytań (nawet w przypadku nieograniczonego czasu działania)?
Grigorij Jarosławcew
Zaktualizowałem pytanie o referencję, która go uzasadniła.
Grigory Yaroslavtsev
1
zaktualizowałem odpowiedź, biorąc pod uwagę twoje zaktualizowane pytanie
Lew Reyzin
Ponadto - w tym przypadku nie sądzę, aby wykładniczy czas działania był pomocny. Ale ogólnie wydaje się, że tak. Nauka (przy optymalnej złożoności próby) jest zazwyczaj łatwa, gdy masz wykładniczy czas.
Lev Reyzin
2
Wielkie dzięki! Potrzebuję trochę czasu, aby sprawdzić referencje, ale jak dotąd wydaje się to kompletna odpowiedź.
Grigorij Jarosławcew