Czytałem nowy artykuł Hintona „Dynamiczne kierowanie między kapsułkami” i nie rozumiałem pojęcia „wektor aktywności” w sposób abstrakcyjny.
Kapsułka to grupa neuronów, których wektor aktywności reprezentuje parametry tworzenia określonego typu bytu, takiego jak obiekt lub część obiektu. Używamy długości wektora aktywności do reprezentowania prawdopodobieństwa istnienia istoty i jej orientacji do reprezentowania parametrów tworzenia instancji. Aktywne kapsułki na jednym poziomie przewidują, za pomocą macierzy transformacji, parametry instancji kapsułek wyższego poziomu. Kiedy wiele prognoz się zgadza, aktywowana jest kapsułka wyższego poziomu. Pokazujemy, że wielowarstwowy system kapsuł wyróżniający się dyskryminacją osiąga najnowocześniejsze osiągi w MNIST i jest znacznie lepszy niż sieć splotowa w rozpoznawaniu nakładających się cyfr. Aby osiągnąć te wyniki, stosujemy iteracyjny mechanizm routingu według umowy:
https://arxiv.org/pdf/1710.09829.pdf
Myślałem, że wektor jest jak tablica danych, które biegasz przez sieć.
Zacząłem pracować na kursie głębokiego uczenia się Andrew Ng, ale wszystko jest nowe, a moje myśli nadążają.
źródło