TLDR:
Sieć neuronowa splotowa jest podklasą sieci neuronowych, które mają co najmniej jedną warstwę splotową. Doskonale nadają się do przechwytywania lokalnych informacji (np. Sąsiednie piksele na obrazie lub otaczające słowa w tekście), a także do zmniejszania złożoności modelu (szybsze szkolenie, wymaga mniejszej liczby próbek, zmniejsza ryzyko nadmiernego dopasowania).
Patrz poniższy wykres, który przedstawia kilka neuronowe sieciami architektur tym głęboko konwencjonalnych sieciach neuronowych-: .
Sieci neuronowe (NN) , a ściślej sztuczne sieci neuronowe (ANN) , to klasa algorytmów uczenia maszynowego, które ostatnio zyskały wiele uwagi (ponownie!) Ze względu na dostępność Big Data i urządzeń do szybkiego przetwarzania danych (większość Deep Learning algorytmy są zasadniczo różnymi odmianami ANN).
Klasa ANN obejmuje kilka architektur, w tym Convolutional Neural Networks ( CNN ), Recurrent Neural Networks ( RNN ) np. LSTM i GRU , Autoencoders i Deep Belief Networks . Dlatego CNN jest tylko jednym rodzajem ANN.
Ogólnie rzecz biorąc, ANN to zbiór połączonych i przestrajalnych jednostek (zwanych także węzłami, neuronami i sztucznymi neuronami), które mogą przekazywać sygnał (zwykle liczbę o wartościach rzeczywistych) z jednej jednostki do drugiej. Liczba (warstw) jednostek, ich typy i sposób, w jaki są ze sobą połączone, nazywany jest architekturą sieci.
W szczególności CNN ma jedną lub więcej warstw jednostek splotu . Jednostka splotu otrzymuje dane wejściowe z wielu jednostek z poprzedniej warstwy, które razem tworzą bliskość. Dlatego jednostki wejściowe (które tworzą małe sąsiedztwo) dzielą się swoimi wagami.
Jednostki splotu (jak również jednostki pulujące) są szczególnie korzystne, ponieważ:
- Zmniejszają liczbę jednostek w sieci (ponieważ są mapowaniami wiele do jednego ). Oznacza to, że jest mniej parametrów do nauczenia się, co zmniejsza ryzyko nadmiernego dopasowania, ponieważ model byłby mniej złożony niż w pełni połączona sieć.
- Rozważają kontekst / wspólne informacje w małych dzielnicach. Ta przyszłość jest bardzo ważna w wielu aplikacjach, takich jak przetwarzanie obrazu / wideo, przetwarzanie tekstów i mowy / wydobywanie, ponieważ sąsiednie wejścia (np. Piksele, ramki, słowa itp.) Zwykle niosą ze sobą powiązane informacje.
Przeczytaj poniższe informacje, aby uzyskać więcej informacji na temat (głębokich) CNN:
- Klasyfikacja ImageNet z głębokimi konwencjalnymi sieciami neuronowymi
- Pogłębiając się dzięki zwojom
ps ANN nie jest „systemem opartym luźno na ludzkim mózgu”, ale raczej klasą systemów inspirowanych połączeniami neuronów w mózgach zwierząt.
Splotowego sieć neuronowa jest jeden, który ma splotowych warstw. Jeśli ogólna sieć neuronowa jest, luźno mówiąc, zainspirowana ludzkim mózgiem (co nie jest zbyt dokładne), splotowa sieć neuronowa jest inspirowana przez system kory wzrokowej u ludzi i innych zwierząt (który jest bliższy prawdy) . Jak sama nazwa wskazuje, warstwa ta stosuje splot z filtrem do nauki (czyli jądro ), w wyniku czego sieć uczy się wzorów na obrazach: krawędzi, narożników, łuków, a następnie bardziej złożonych figur. Konwolucyjna sieć neuronowa może również zawierać inne warstwy, zwykle pule i gęste warstwy.
Bardzo polecam samouczek CS231n na ten temat: jest bardzo szczegółowy i zawiera wiele bardzo ładnych wizualizacji.
źródło