Zastanawiałem się, czy w pewnych okolicznościach jest możliwe, aby ANN działały lepiej, jeśli odetniesz na nich niektóre połączenia, na przykład:
Konstruujesz jeden ANN, biorąc równolegle dwa wielowarstwowe ANN A i B (te same węzły wejściowe i wyjściowe), dodając kilka połączeń „komunikacyjnych” między ukrytymi warstwami A i B?
Czy można uzyskać lepsze wyniki uogólnienia?
Czy jest to w jakiś sposób wykorzystywane w praktyce, czy zawsze używa się wyłącznie wielowarstwowych, w pełni połączonych sieci?
classification
neural-networks
SlimJim
źródło
źródło
Z reguły małe i / lub rzadkie sieci generalizują się lepiej. Możesz pozwolić swojemu algorytmowi treningowemu zlikwidować niepotrzebne połączenia w sieci o stałym rozmiarze, stosując pewną formę zaniku masy, lub możesz zastosować algorytm, który ma na celu optymalizację samej architektury / topologii sieci poprzez usunięcie niepotrzebnych danych wejściowych, ukrytych węzłów lub połączeń.
Zapoznaj się z tymi źródłami pomysłów i punktów wyjścia do dalszych badań lub przyjrzyj się wykorzystaniu algorytmów ewolucyjnych do projektowania, przycinania i optymalizacji architektur.
źródło
W większości przypadków, jeśli usuniesz niepotrzebne połączenia, uzyskasz lepszą sieć. Łatwo jest przeciążać (zastępować) sieć - w takim przypadku będzie słabo działać na zbiorze danych sprawdzania poprawności.
Przycinanie niepotrzebnych połączeń najprawdopodobniej zmniejszy prawdopodobieństwo przetrenowania. Zobacz: http://en.wikipedia.org/wiki/Overfitting .
źródło
Tak to mozliwe. Możemy rozważyć połączenie między jednostkami obliczeniowymi, liczbę ukrytych warstw, jednostek na ukrytą warstwę itp. Jako hiper-parametry. Możliwe jest znalezienie optymalnych wartości dla tych parametrów, przeprowadzając serię eksperymentów.
Na przykład:
Możesz podzielić swój zestaw danych w następujący sposób: Zestaw treningowy 60% danych, Cross-validation 20% danych, Testowanie 20% danych,
Następnie wytrenuj swój NN za pomocą zestawu danych treningowych i parametru strojenia za pomocą zestawu danych walidacji krzyżowej.
Wreszcie możesz użyć zestawu danych testowych do oceny wydajności Twojej NN.
źródło