liczba map obiektów w splotowych sieciach neuronowych

16

Ucząc się splotowej sieci neuronowej, mam pytania dotyczące poniższego rysunku.

1) C1 w warstwie 1 ma 6 map obiektów, czy to oznacza, że ​​istnieje sześć zwojów splotowych? Każde jądro splotowe służy do generowania mapy obiektów na podstawie danych wejściowych.

2) S1 w warstwie 2 ma 6 map obiektów, C2 ma 16 map obiektów. Jak wygląda proces uzyskiwania 16 map funkcji w oparciu o 6 map funkcji w S1?

wprowadź opis zdjęcia tutaj

użytkownik3269
źródło

Odpowiedzi:

13

1) C1 w warstwie 1 ma 6 map obiektów, czy to oznacza, że ​​istnieje sześć jąder splotowych? Każde jądro splotowe służy do generowania mapy obiektów na podstawie danych wejściowych.

Istnieje 6 zwojów splotowych i każde z nich służy do generowania mapy obiektów na podstawie danych wejściowych. Innym sposobem na powiedzenie tego jest to, że istnieje 6 filtrów lub zestawów 3D odważników, które po prostu nazywam odważnikami. To, czego ten obraz nie pokazuje, prawdopodobnie powinien, aby było jaśniejsze, to zwykle obrazy mają 3 kanały, powiedzmy czerwony, zielony i niebieski. Wagi mapujące cię od wejścia do C1 mają kształt / wymiar 3x5x5, a nie tylko 5x5. Te same trójwymiarowe wagi lub jądro są stosowane na całym obrazie 3x32x32 w celu wygenerowania dwuwymiarowej mapy cech w C1. W tym przykładzie jest 6 jąder (każde 3x5x5), co tworzy 6 map obiektów (każde 28x28, ponieważ krok wynosi 1, a wypełnienie wynosi zero) w tym przykładzie, z których każde jest wynikiem zastosowania jądra 3x5x5 na wejściu.

2) S1 w warstwie 1 ma 6 map obiektów, C2 w warstwie 2 ma 16 map obiektów. Jak wygląda proces uzyskiwania 16 map funkcji w oparciu o 6 map funkcji w S1?

Teraz zrób to samo, co zrobiliśmy w warstwie pierwszej, ale zrób to dla warstwy 2, z tym razem, że liczba kanałów nie wynosi 3 (RGB), ale 6, sześć dla liczby map obiektów / filtrów w S1. Istnieje teraz 16 unikalnych jąder, każdy o kształcie / wymiarze 6x5x5. każde jądro warstwy 2 jest stosowane w całym S1, aby wygenerować mapę obiektów 2D w C2. Odbywa się to 16 razy dla każdego unikalnego jądra w warstwie 2, wszystkie 16, aby wygenerować 16 map obiektów w warstwie 2 (każde 10x10, ponieważ krok jest równy 1, a wypełnienie wynosi zero)

źródło: http://cs231n.github.io/convolutional-networks/

Carson Lam
źródło