Jestem początkującym w uczeniu maszynowym. W SVM hiperpłaszczyzna oddzielająca jest zdefiniowana jako . Dlaczego mówimy wektor prostopadła do hiperpłaszczyzny rozdzielającej?
machine-learning
svm
Chong Zheng
źródło
źródło
Odpowiedzi:
Geometrycznie wektor w jest skierowany prostopadle do linii określonej przez . Można to rozumieć w następujący sposób:wTx=b
Najpierw weź . Teraz jest jasne, że wszystkie wektory, x , z zanikającym iloczynem wewnętrznym w, spełniają to równanie, tj. Wszystkie wektory prostopadłe do w spełniają to równanie.b=0 x w
Przetłumacz teraz hiperpłaszczyznę od początku na wektor a. Równanie dla płaszczyzny staje się teraz: , tzn. Widzimy, że dla przesunięcia b = a T w , które jest rzutem wektora a na wektor w .(x−a)Tw=0 b=aTw a w
Bez utraty ogólności możemy zatem wybrać prostopadłą do płaszczyzny, w którym to przypadku długość który reprezentuje najkrótszą, ortogonalną odległość między początkiem a hiperpłaszczyzną.| | a | | = | b |/ | | w| |
Dlatego mówi się, że wektor jest ortogonalny względem oddzielającej hiperpłaszczyzny.w
źródło
Powodem, dla którego jest normalne dla hiperpłaszczyzny, jest to, że definiujemy to w ten sposób:w
Załóżmy, że mamy (hiper) płaszczyznę w przestrzeni 3D. Niech będzie punktem na tej płaszczyźnie, tj. P 0 = x 0 , y 0 , z 0 . Dlatego wektor od początku ( 0 , 0 , 0 ) do tego punktu wynosi tylko < x 0 , y 0 , z 0 > . Załóżmy, że mamy dowolny punkt P ( x , y , z ) na płaszczyźnie. Wektor łączący PP.0 P.0= x0, y0, z0 ( 0 , 0 , 0 ) < x0, y0, z0> P.( x , y, z) P. a jest następnie podane przez:
→ P - → P 0 = < x - x 0 , y - y 0 , z - z 0 >
Zauważ, że ten wektor leży w płaszczyźnie.P.0
Teraz n jest normalny (prostopadłego) do wektora do samolotu. Dlatego: n ∙ ( → P - → P 0 ) = 0 więc: n ∙ → P - n ∙ → p 0 = 0 Należy zauważyć, że - n ∙ → p 0 jest tylko liczba i wynosi b w nasza sprawa, natomiast n jest tylko w i → Pn^
źródło
źródło
Używając algebraicznej definicji wektora prostopadłego do hiperpłaszczyzny:
źródło