Zdefiniujmy klasę funkcji w zbiorze bitów. Napraw dwa rozkłady które są „rozsądnie” różne od siebie (jeśli chcesz, ich odległość wariacyjna wynosi co najmniej lub coś podobnego).
Teraz każda funkcja w tej klasie jest zdefiniowana przez zbiór indeksów i jest oceniana w następujący sposób: Jeśli parzystość wybranych bitów wynosi 0, zwróć losową próbkę z , w przeciwnym razie zwróć losową próbkę z .
Problem : Załóżmy, że mam dostęp do wyroczni do niektórych z tej klasy i chociaż znam (lub inną miarę odległości), nie znam i .
Czy są jakieś ograniczenia co do liczby połączeń, które muszę wykonać, aby PAC-learn ? Przypuszczalnie moja odpowiedź będzie w kategoriach n , k i ϵ .
Uwaga : nie określiłem domeny wyjściowej. Znowu jestem elastyczny, ale na razie powiedzmy, że i q są zdefiniowane w domenie skończonej [ 1 .. M ] . Zasadniczo byłbym również zainteresowany przypadkiem, gdy są one zdefiniowane powyżej R (na przykład, jeśli są Gaussowcami)
źródło
Odpowiedzi:
Dyskusja w komentarzach poniżej wskazuje, że źle zrozumiałem pytanie. Moja odpowiedź jest oparta na Oracle sobą nie wejście i powrót , gdzie x ~ p lub x ~ q , w zależności od f ∈ F . Najwyraźniej nie o to pytano.(x,f(x)) x∼p x∼q f∈F
Ponieważ rozkład celu jest ustalony dla każdego celu , obowiązuje górna granica próbki PAC (wynika to z faktu, że rozkład celu dla tej granicy może nawet całkowicie zależeć od f ∗ ). Stąd m ≤ ˜ O ( 1f∗∈F f∗
przykłady powinny wystarczyć, aby znaleźć hipotezę błędu≤ϵwp≥1-δ. Uwaga - po zapoznaniu się z tymi przykładami należy znaleźć spójną hipotezę zFi może to nie być wykonalne.
Z drugiej strony, można uzyskać prawie pasującą dolną granicę, nawet w przypadku , rozkład równomierny, gdzie wciąż wymagane są przykłady m ≥ Ω ( V C ( F ) ) (można to nieco poprawić) .p=q=U m≥Ω(VC(F))
Odległość wariacyjna między i q , a także k mogą odgrywać rolę w małej szczelinie między tymi granicami, ale wątpię w to.p q k
źródło
def fitness() ...
random_number_generator.set_seed(x)