Jako tekst wprowadzający do wszystkich zagadnień, które wymienisz, poleciłbym książkę do głębokiego uczenia się . Zapewnia szeroki przegląd tej dziedziny. Wyjaśnia rolę każdego z tych parametrów.
Moim zdaniem bardzo pomocne jest zapoznanie się z niektórymi najpopularniejszymi architekturami (resnet, incepcja, alex-net) i wydobycie kluczowych pomysłów prowadzących do decyzji projektowych. Po przeczytaniu wyżej wymienionej książki.
W sylabusie wykładów, do których się odwołujesz, wyjaśniono bardzo szczegółowo, w jaki sposób warstwa splotowa dodaje dużą liczbę parametrów (wag, odchyleń) i neuronów. Po wyszkoleniu ta warstwa jest w stanie wydobyć znaczące wzory z obrazu. W przypadku niższych warstw filtry te wyglądają jak ekstraktory krawędzi. W przypadku wyższych warstw te prymitywne kształty są łączone w celu opisania bardziej złożonych form. Filtry te wiążą się z dużą liczbą parametrów i dużym problemem przy projektowaniu głębokich sieci, w jaki sposób można opisać złożone formy i nadal być w stanie zmniejszyć liczbę parametrów.
Ponieważ sąsiednie piksele są silnie skorelowane (szczególnie w najniższych warstwach), sensowne jest zmniejszenie wielkości wyjściowej przez podpróbkowanie (łączenie) odpowiedzi filtra. Im dalej dwa piksele są od siebie, tym mniej skorelowane. Dlatego duży krok w warstwie pulowania prowadzi do dużej utraty informacji. Swobodnie rozmawiać. Krok 2 i rozmiar jądra 2x2 dla warstwy puli to powszechny wybór.
Bardziej wyrafinowanym podejściem jest sieć Incepcji ( głębiej ze zwojami ), w której chodzi o zwiększenie rzadkości, ale nadal jest w stanie osiągnąć wyższą dokładność, poprzez wymianę liczby parametrów w warstwie splotowej w porównaniu z modułem początkowym dla głębszych sieci.
Przyjemny papier, który zawiera wskazówki na temat bieżącej architektury i roli niektórych wymiarów projektowych w uporządkowany, systematyczny sposób, to SqueezeNet: dokładność na poziomie AlexNet z 50x mniejszą liczbą parametrów i wielkości modelu <0,5 MB . Opiera się na pomysłach wprowadzonych we wcześniej wspomnianych modelach.