Papier Idąc głębiej ze zwojów opisuje GoogleNet który zawiera oryginalne moduły powstania:
Zmiana na początek v2 polegała na tym, że zastąpiły one splot 5x5 dwoma kolejnymi splotami 3x3 i zastosowały pule:
Jaka jest różnica między Inception v2 a Inception v3?
image-classification
convnet
computer-vision
inception
Martin Thoma
źródło
źródło
Odpowiedzi:
W artykule Batch Normalization , Sergey i in., 2015. zaproponował architekturę Inception-v1, która jest wariantem GoogleNet w artykule Idąc głębiej ze zwojami , a tymczasem wprowadzono normalizację wsadową do Inception (BN-Inception).
W artykule „ Przemyślenie architektury Incepcji na rzecz wizji komputerowej ” autorzy zaproponowali Inception-v2 i Inception-v3.
W Inception-v2 wprowadzili faktoryzację (rozkładają zwoje na mniejsze) i wprowadzili drobne zmiany w Inception-v1.
Jeśli chodzi o Inception-v3 , jest to wariant Inception-v2, który dodaje pomocnicze BN.
źródło
oprócz tego, o czym wspomniał daoliker
inception v2 wykorzystywał separowalny splot jako pierwszą warstwę głębokości 64
cytat z papieru
dlaczego to jest ważne ponieważ został upuszczony w v3 i v4 i początkowej resnet, ale ponownie wprowadzony i intensywnie używany w mobilenet później.
źródło
Odpowiedź można znaleźć w dokumencie Going deeper with convolutions: https://arxiv.org/pdf/1512.00567v3.pdf
Sprawdź tabelę 3. Incepcja v2 to architektura opisana w dokumencie „Przechodzenie głębiej ze splotami”. Inception v3 to ta sama architektura (niewielkie zmiany) z innym algorytmem szkoleniowym (RMSprop, regulizator wygładzania etykiet, dodawanie głowicy pomocniczej z normą wsadową w celu poprawy treningu itp.).
źródło
W rzeczywistości powyższe odpowiedzi wydają się błędne. Rzeczywiście, było to wielki bałagan z nazywaniem. Wydaje się jednak, że zostało to naprawione w artykule, który wprowadza Inception-v4 (patrz: „Inception-v4, Inception-ResNet i wpływ pozostałych połączeń na uczenie się”):
źródło