1D Konwolucja w sieciach neuronowych

9

Rozumiem, jak działa splot, ale nie rozumiem, w jaki sposób splot 1D jest stosowany do danych 2D.

Splot 2D

W tym przykładzie widać splot 2D w danych 2D. Ale jak by to było, gdyby był splot 1D? Tylko jądro 1D przesuwa się w ten sam sposób? A jeśli krok miał 2?

Dziękuję Ci!

Gustavo
źródło
1
Wystarczy spojrzeć na pierwszy wiersz każdej matrycy.
Piotr Migdal
Czy możesz podać mi przykład?
Gustavo,
Zwinięcia 1d nie byłyby naprawdę przydatne w przypadku ścisłego obrazu 2D. Obrazy w skali szarości są technicznie 3D, ponieważ mają trzy kanały kolorów.
Ethan
1
@Gustavo Podobnie jak ten: toto-share.com/wp-content/uploads/2011/11/... Chyba że masz na myśli splot 1x1 (w sensie sieci neuronowych), co jest inną rzeczą.
Piotr Migdal
Mój problem dotyczy zwojów takich jak: d3kbpzbmcynnmx.cloudfront.net/wp-content/uploads/2015/11/... Istnieją dwa zwoje , jeden z wielkością jądra 3, a drugi z wielkością 2 ... Ale te jądra mają rozmiar 1D lub rozmiar xk ?
Gustavo

Odpowiedzi:

2

Pozwolić x1,,xnbyć sekwencją wektorów (np. wektorów słów). Zastosowanie warstwy splotowej jest równoważne z zastosowaniem tej samej macierzy masy do wszystkich n-gramów, gdziento wysokość twojego filtra. Np. Jeślin=3, możesz to wizualizować w następujący sposób:

wprowadź opis zdjęcia tutaj

Aby uzyskać nieco bardziej matematyczne wyjaśnienie, sprawdź Ji Young Lee, Franck Dernoncourt. „ Sekwencyjna klasyfikacja krótkich tekstów z rekurencyjnymi i splotowymi sieciami neuronowymi ”. NAACL 2016 . sekcja 2.1.2:

wprowadź opis zdjęcia tutaj

Franck Dernoncourt
źródło
1

Splot 1D stosuje się w sieciach splotowych do próbkowania w dół i próbkowania w górę w wymiarze filtra. Sieci konwergentne tworzą te mapy filtrów, gdy przechodzisz przez sieć, możesz naprawdę myśleć o nich jako o trzecim wymiarze. Zwykle podstawowy przypadek wymiaru mapy filtra ma rozmiar 3, ponieważ często będziemy mieć obrazy RGB przechodzące przez naszą sieć.

Te sploty 1D mogą być przydatne do próbkowania w dół, wykonywania niektórych operacji, a następnie próbkowania w górę z powrotem do tego samego wymiaru. Jest to bardzo przydatne ze względu na wydajność.

Aby naprawdę intuicyjnie zrozumieć, sugerowałbym przeczytanie:

Sieć w sieci - http://arxiv.org/abs/1312.4400

Sięgnij głębiej ze zwojami - https://www.google.com/url?sa=t&source=web&rct=j&url=http://www.cs.unc.edu/~wliu/papers/GoogLeNet.pdf&ved=0ahUKEwi89oeuxqnLAhXhuIMKHZrTCe0QFggAEQQGGCMEQQGGCMEQQGGCMEQQGGCMEQQGGMEQQGGMEQQGGEQQGGEQQGGEQQGGEQQGGQMEQQGGEQQGGQMEQQGGEQQGGQMEQQGGEQQGGQMEQQGGEQQGGQMEQQGGEQQGGQM0Q rrECNQ72wI3PH1Qw & sig2 = VhjfaMvuskNIDVKhFfNiqQ

Ethan
źródło
4
Wygląda na to, że mówisz o zwojach 1x1 (w sensie sieci neuronowych), a nie zwojach 1D.
Piotr Migdal
Tak, założyłem, że w grę wchodzą sieci neuronowe. Natrafiłem na link do tego pytania w / r / MLQuestions na reddit, więc założyłem, że jest to związane z ML. Ale dla zwykłego splotu nie jest to tak istotne: P.
Ethan,