Studiuję uczenie maszynowe i chciałbym wiedzieć, jak obliczyć wymiar VC.
Na przykład:
, z parametrami.
Jaki jest jego wymiar VC?
Studiuję uczenie maszynowe i chciałbym wiedzieć, jak obliczyć wymiar VC.
Na przykład:
, z parametrami.
Jaki jest jego wymiar VC?
Wymiar VC jest oszacowaniem zdolności klasyfikatora binarnego. Jeśli możesz znaleźć zestaw punktów, aby mógł zostać rozbity przez klasyfikator (tj. Poprawnie sklasyfikuj wszystkie możliwe 2 n oznakowania) i nie możesz znaleźć żadnego zestawu n + 1 punktów, który można rozbić (tj. Dla dowolnego zestawu n + 1 punktów istnieje co najmniej jedna kolejność etykietowania, aby klasyfikator nie mógł poprawnie rozdzielić wszystkich punktów), wówczas wymiar VC wynosi n .
W twoim przypadku najpierw rozważ dwa punkty i x 2 , tak aby x 1 < x 2 . Następnie są 2 2 = 4 możliwe oznaczenia
Wszystkie oznaczenia można uzyskać za pomocą klasyfikatora , ustawiając parametry a < b ∈ R takie, że
odpowiednio. (W rzeczywistości można założyć wlog, ale wystarczy znaleźć jeden zestaw, który można rozbić.)
Rozważmy teraz trzy arbitralne (!) Punkty , x 2 , x 3, a wlog zakłada x 1 < x 2 < x 3 , wtedy nie można osiągnąć oznaczenia (1,0,1). Podobnie jak w przypadku 3 powyżej, etykiety x 1 : 1 i x 2 : 0 oznaczają a < x 1 < b < x 2 . Co implikuje x 3 > b, a zatem etykietę x 3 musi wynosić 0. Zatem klasyfikator nie może rozbić żadnego zestawu trzech punktów, a zatem wymiar VC wynosi 2.
-
Może staje się bardziej zrozumiały dzięki bardziej przydatnemu klasyfikatorowi. Rozważmy hiperpłaszczyzny (tj. Linie w 2D).
Łatwo jest znaleźć zestaw trzech punktów, które można poprawnie sklasyfikować bez względu na sposób ich oznaczenia:
Dla wszystkich możliwych etykiet możemy znaleźć hiperpłaszczyznę, która je doskonale oddziela.
Nie możemy jednak znaleźć żadnego zestawu 4 punktów, abyśmy mogli poprawnie sklasyfikować wszystkie możliwych etykiet. Zamiast formalnego dowodu staram się przedstawić argument wizualny:
Załóżmy na razie, że 4 punkty tworzą figurę z 4 bokami. Wówczas niemożliwe jest znalezienie hiperpłaszczyzny, która może poprawnie oddzielić punkty, jeśli oznaczymy przeciwległe rogi tą samą etykietą:
Jeśli nie tworzą figury z 4 bokami, istnieją dwa „przypadki graniczne”: „Zewnętrzne” punkty muszą albo tworzyć trójkąt, albo wszystkie tworzyć linię prostą. W przypadku trójkąta łatwo zauważyć, że nie można osiągnąć etykietowania, w którym punkt „wewnętrzny” (lub punkt między dwoma rogami) jest inny niż pozostałe:
W przypadku segmentu linii obowiązuje ten sam pomysł. Jeśli punkty końcowe są oznaczone inaczej niż jeden z innych punktów, nie można ich rozdzielić hiperpłaszczyzną.
Ponieważ omówiliśmy wszystkie możliwe formacje 4 punktów w 2D, możemy stwierdzić, że nie ma 4 punktów, które można by rozbić. Dlatego wymiar VC musi wynosić 3.
Wymiar VC klasyfikatora określa się w następujący sposób:
Tak więc musi być tylko jeden sposób na umieszczenie trzech punktów, tak aby wszystkie możliwe rozkłady klas między tym rozmieszczeniem punktów mogły zostać sklasyfikowane we właściwy sposób.
Jeśli nie umieścisz trzech punktów na linii, percepcja zrobi to dobrze. Ale nie ma sposobu, aby uzyskać postrzeganie sklasyfikować wszystkie możliwe rozkłady klas 4 punktów, bez względu na to, jak umieścisz punkty
Twój przykład
VC-Dimension 2: Może poprawnie sklasyfikować wszystkie cztery sytuacje.
Wymiar VC 3: Nie, to nie działa. Wyobraź sobie klasy
true
ifalse
porządekTrue False True
. Twój klasyfikator nie może sobie z tym poradzić. Dlatego ma VC-Wymiar 2.Dowód
źródło