Nie mam żadnego tła z matematyki, ale rozumiem, jak działa prosty Perceptron i myślę, że rozumiem pojęcie hiperpłaszczyzny (wyobrażam sobie to geometrycznie jako płaszczyznę w przestrzeni 3D, która oddziela dwie chmury punktów, tak jak linia dzieli się dwie chmury punktów w przestrzeni 2D).
Ale nie rozumiem, w jaki sposób jedna płaszczyzna lub jedna linia mogłaby oddzielić trzy różne chmury punktów odpowiednio w przestrzeni 3D lub w przestrzeni 2D - jest to geometrycznie niemożliwe, prawda?
Próbowałem zrozumieć odpowiednią sekcję w artykule w Wikipedii , ale już niestety zawiodłem zdanie „Tutaj dane wejściowe x i dane wyjściowe y są pobierane z dowolnych zbiorów”. Czy ktoś mógłby mi wytłumaczyć wieloklasowy perceptron i jak to idzie z ideą hiperpłaszczyzny, a może wskazać mi niezbyt matematyczne wyjaśnienie?