Jakie znaczenie ma liczba filtrów splotowych w sieci splotowej?

16

Jaka jest liczba filtrów w warstwie splotowej?
Jak ta liczba wpływa na wydajność lub jakość architektury? Mam na myśli, czy zawsze powinniśmy wybierać większą liczbę filtrów? co z nich dobrego? i W jaki sposób ludzie przypisują różną liczbę filtrów dla różnych warstw? Mam na myśli spojrzenie na to pytanie: jak ustalić liczbę operatorów splotowych w CNN?
W odpowiedzi określono 3 warstwy splotu z różną liczbą filtrów i wielkości. Ponownie w tym pytaniu: liczba map cech w splotowych sieciach neuronowych z obrazka widać, że mamy 28 * 28 * 6 filtrów dla pierwszej warstwy i filtr 10 * 10 * 16 dla drugiej warstwy konwekcyjnej. Jak wymyślają te liczby, czy jest to metodą prób i błędów? Z góry dziękuję

Rika
źródło

Odpowiedzi:

8

Jaka jest liczba filtrów w warstwie splotowej? - Zwykle lubię myśleć o filtrach jako detektorach funkcji. Chociaż zależy to od dziedziny problemów, znaczeniem # detektorów funkcji intuicyjnie jest liczba funkcji (takich jak krawędzie, linie, części obiektów itp.), Których sieć może potencjalnie nauczyć się. Pamiętaj również, że każdy filtr generuje mapę obiektów. Mapy funkcji pozwalają poznać czynniki objaśniające na obrazie, więc im więcej filtrów #, tym więcej się uczy sieci (niekoniecznie dobre przez cały czas - najważniejsze są nasycenie i zbieżność)

Jak ta liczba wpływa na wydajność lub jakość architektury? - Nie sądzę, że znajdziesz dobrą odpowiedź na tego rodzaju pytania, ponieważ wciąż próbujemy sformalizować to, co dzieje się w czarnej skrzynce DL. Intuicyjnie po raz kolejny nauczysz się solidniejszej funkcji nieliniowej, im więcej posiadasz banków filtrów, jednak wydajność zależeć będzie od rodzaju zadania i charakterystyki danych. Zazwyczaj chcesz wiedzieć, z jakimi danymi masz do czynienia, aby określić # parametry w swojej architekturze (w tym filtr). Ile filtrów potrzebuję? bardziej przypomina pytanie, jak złożone (specjalnie) są obrazy w moim zbiorze danych. Nie ma żadnego formalnego pojęcia, które wiązałoby # filtry z wydajnością. Wszystko jest eksperymentalne i iteracyjne. Wiele szlaków i błędów.

Henok G.
źródło
Dobra odpowiedź, dodająca do powyższych punktów: CNN nie są już czarnymi skrzynkami. Rzeczywiście możesz zobaczyć funkcje wyuczone przez mapy funkcji. Liczba filtrów, które ustawisz w warstwie, pozwala sieci ENOUGH na połączenie w sieć w celu poznania odpowiednich funkcji (lub ich kombinacji). Jaka jest wystarczająca liczba -> zależy od zestawu danych. Powiedzmy, że sieć CNN w warstwie X potrzebuje co najmniej 24 map obiektów, aby nauczyć się ważnych funkcji, więc dajesz, powiedzmy, 32, pracując nad pomysłem, że dajesz sieci przestrzeń do oddychania i pozwalasz jej sam zdecydować, być może niektóre z 32 są zbędne lub nieco zróżnicowane.
MANU,