Próbuję zrozumieć część splotową sieci neuronowych splotowych. Patrząc na następujący rysunek:
Nie mam problemów ze zrozumieniem pierwszej warstwy splotu, w której mamy 4 różne jądra (o wielkości ), które splatamy z obrazem wejściowym, aby uzyskać 4 mapy cech.
To, czego nie rozumiem, to kolejna warstwa splotu, w której przechodzimy od 4 map obiektów do 6 map obiektów. Zakładam, że mamy w tej warstwie 6 jąder (co daje 6 wyjściowych map obiektów), ale jak te jądra działają na 4 mapach obiektów pokazanych w C1? Czy jądra są trójwymiarowe, czy też są dwuwymiarowe i są replikowane na 4 wejściowych mapach cech?
Odpowiedzi:
Jądra są trójwymiarowe, w których można wybrać szerokość i wysokość, a głębokość jest równa liczbie map w warstwie wejściowej - ogólnie.
Z pewnością nie są dwuwymiarowe i są replikowane na mapach obiektów wejściowych w tej samej lokalizacji 2D! Oznaczałoby to, że jądro nie będzie w stanie rozróżnić funkcji wejściowych w danej lokalizacji, ponieważ użyje tej samej wagi na mapach funkcji wejściowych!
źródło
Nie ma konieczności bezpośredniej korespondencji między warstwami i jądrami. To zależy od konkretnej architektury. Przedstawiony rysunek sugeruje, że na warstwach S2 masz 6 map obiektów, z których każda łączy wszystkie mapy obiektów z poprzednich warstw, tj. Różne możliwe kombinacje cech.
Bez dalszych referencji nie mogę powiedzieć nic więcej. Zobacz na przykład ten artykuł
źródło
Tabela 1 i sekcja 2a „Uczenia się opartego na gradiencie zastosowanego do rozpoznawania dokumentów” Yanna LeCuna wyjaśnia to dobrze: http://yann.lecun.com/exdb/publis/pdf/lecun-01a.pdf Nie wszystkie regiony splotu 5x5 są służy do generowania drugiej warstwy splotowej.
źródło
Ten artykuł może być pomocny: Zrozumienie konwolucji w głębokim uczeniu się autorstwa Tim Dettmers z 26 marca
Naprawdę nie odpowiada na pytanie, ponieważ wyjaśnia tylko pierwszą warstwę splotu, ale zawiera dobre wyjaśnienie podstawowej intuicji na temat splotu w CNN. Opisuje także głębszą matematyczną definicję splotu. Myślę, że ma to związek z tematem pytania.
źródło