Głębokie sieci neuronowe - tylko do klasyfikacji obrazów?

14

Wszystkie przykłady, które znalazłem przy użyciu głębokiej wiary lub splotowych sieci neuronowych, wykorzystują je do klasyfikacji obrazu, wykrywania czatu lub rozpoznawania mowy.

Czy głębokie sieci neuronowe są również przydatne w przypadku klasycznych zadań regresyjnych, w których cechy nie są ustrukturyzowane (np. Nie są ułożone w sekwencji lub siatce)? Jeśli tak, czy możesz podać przykład?

juliański
źródło
3
Twoje pierwsze zdanie wywołuje splotowe sieci neuronowe. Wygląda na to, że mylisz je z sieciami głębokiej wiary. Nie są takie same, chociaż oba są formami sieci neuronowych.
MSalters
1
Zgodziłbym się z @msalters, ale powiedziałbym, że sieci głębokiego przekonania są naprawdę głębokimi sieciami i odniosły ograniczony sukces, podczas gdy sieci splotowe są bardziej jak hybrydowo-adaptacyjne filtry obrazu w warstwach splotowych, po których następuje płaska nn.
seanv507,
Co rozumiesz przez „obserwacje”, które „nie mają struktury (nie są ułożone w sekwencji ani w siatkę)”? Czy mówisz o „strukturze” obrazów w tym sensie, że poszczególne piksele są ułożone na siatce? Ale czy to cechy, które są „ustrukturyzowane”, a nie „obserwacje” (byłyby to pojedyncze obrazy)?
ameba mówi Przywróć Monikę
Powiedziałbym, że wszystkie sieci Konwolucji są głębokie, nie wszystkie są sieciami głębokimi splotami i podobnie wszystkie sieci głębokich przekonań są głębokie, nie wszystkie sieci głębokie są sieciami głębokich przekonań. Rzeczywiście możesz mieć głębokie sieci, które nie są ani głębokie, ani splotowe, po prostu ciężko je trenować. Jednak z pewnością istnieje pole do bezcelowej debaty na temat terminologii.
Lyndon White,
Nie można zastosować sieci splotowej do danych nieustrukturyzowanych (nie w sekwencji / siatce itp.). Zasadniczo nie ma to sensu. Sieć splotowa jest ściśle związana z pobieraniem transformacji Fouriera z twojego wejścia - np. Dla sekwencji przekształcających ją z dziedziny czasu do dziedziny częstotliwości.
Lyndon White,

Odpowiedzi:

8

Cechy obrazów, które umożliwiają ich klasyfikację za pomocą głębokiej sieci neuronowej, to mnóstwo funkcji (być może miliony, jeśli nie miliardy pikseli z RGB, intensywność itp.), A jeśli masz dokładne etykiety, nie są to dane zaszumione. Kamery w dzisiejszych czasach są bardzo dobre i niczego nie mierzą źle. Dzięki Internetowi mamy teraz wiele dokładnie oznaczonych zdjęć. Głęboka sieć może wyrażać dowolnie skomplikowane funkcje, co jest problemem w przypadku zaszumionych danych, ponieważ bardzo łatwo można prześcignąć hałas, dlatego wiele metod uczenia się ma tendencję do karania skomplikowanych modeli. Jednak w przypadku rozpoznawania obrazów prawdziwa funkcja wydaje się być bardzo skomplikowana, nie mamy pojęcia, jak wygląda forma funkcjonalna, a nawet nie wiemy, jakie są odpowiednie funkcje w wielu przypadkach.

Nie oznacza to, że nie możesz używać głębokich sieci do nauki funkcji, które nie mają nic wspólnego z obrazami. Trzeba tylko bardzo uważać na wady, głównie dlatego, że jest on bardzo podatny na przeregulowanie, ale także, że jest on drogi pod względem obliczeniowym i może trenować długo (nie jest to obecnie tak duży problem z równoległymi SGD i GPU). Drugą wadą jest to, że masz bardzo małą lub żadną interpretację modelu, co tak naprawdę nie ma znaczenia dla klasyfikacji obrazu. Próbujemy tylko przekonać komputery do rozpoznania różnicy między szympansem a orangutanem. Ludzkie zrozumienie formuły nie ma znaczenia. W przypadku innych dziedzin, zwłaszcza diagnostyki medycznej, badań polityki itp., Potrzebujesz lub nawet potrzebujesz ludzkiego zrozumienia.

Adam Acosta
źródło
5

Na pewno możesz używać głębokich sieci neuronowych do wielu problemów oprócz rozpoznawania obrazu lub mowy. Problem polega na tym, czy naprawdę tego potrzebujesz.

Głębokie sieci neuronowe są znacznie potężniejsze niż zwykła MLP, ale wymagają również więcej zasobów i są trudniejsze do rozwoju. Dlatego są używane w naprawdę złożonych domenach. Można ich użyć do rozwiązania łatwiejszych problemów, ale zwykle prostsze modele również dają dobre wyniki.

Używanie głębokich sieci neuronowych do łatwych problemów będzie jak zabijanie much za pomocą bazooki, na pewno je zabijesz, ale czy nie możesz znaleźć prostszego sposobu?

davidivad
źródło
2
To nie jest odpowiedź. Co jest łatwe, a co trudne? Przewidywanie rynku akcji / ekstrapolacja na podstawie ograniczonych przykładów / ... ISTNIEJE wiele trudnych problemów, czy głębokie są dobre w ogóle?
seanv507,
Nie powiedziałem, że głębokie sieci neuronowe mogą rozwiązać wszystko. Chodzi mi o to, że są one używane w złożonych domenach, w których znajduje się ogromna liczba wpisów. Wiem, że nie mogą rozwiązać każdego problemu, ale nie o to chodzi w tym pytaniu. Chodzi o podkreślenie, że można je zastosować do innych problemów oprócz rozpoznawania obrazu / mowy, ale mają one wady, które warto rozważyć w przypadkach, w których można zastosować inne modele.
davidivad,
5

Zgadzam się z odpowiedzią dawidiwada. Ale myślę też, że zastosowanie głębokich sieci neuronowych do obrazów polega na tym, że obrazy (i, co ważniejsze, obrazy oznaczone etykietami ) są stosunkowo niedrogie w gromadzeniu. W innych domenach gromadzenie danych na dużą skalę może być bardzo kosztowne, szczególnie w ramach ograniczeń typowego przedsiębiorstwa przemysłowego lub rządowego. Problemem komplikuje się to, że w wielu aplikacjach zjawisko zainteresowania jest stosunkowo rzadkie, więc będzie kilka cennych przykładów do nauczenia się, więc nawet gromadzenie danych na stosunkowo dużą skalę może dać niewielką liczbę członków jakiejś klasy.

Sycorax mówi Przywróć Monikę
źródło