Czy pojedyncza sieć neuronowa może obsługiwać rozpoznawanie dwóch typów obiektów, czy też powinna być podzielona na dwie mniejsze sieci?

W szczególności komputer wbudowany (z ograniczonymi zasobami) analizuje strumień wideo na żywo z kamery drogowej, próbując wybrać dobre klatki zawierające numery rejestracyjne przejeżdżających samochodów. Po zlokalizowaniu płytki ramka jest przekazywana do biblioteki OCR w celu wyodrębnienia rejestracji i dalszego jej wykorzystania.

W moim kraju powszechnie stosuje się dwa rodzaje tablic rejestracyjnych - prostokątne (typowe) i kwadratowe - właściwie nieco prostokątne, ale „wyższe niż szersze”, z rejestracją podzieloną na dwa rzędy.

(istnieje kilka innych typów, ale pomińmy je; stanowią one niewielki procent i zwykle należą do pojazdów, które nie są przedmiotem naszego zainteresowania).

Ze względu na ograniczone zasoby i potrzebę szybkiego przetwarzania w czasie rzeczywistym maksymalny rozmiar sieci (liczba komórek i połączeń) obsługiwany przez system jest stały.

Czy lepiej byłoby podzielić to na dwie mniejsze sieci, z których każda rozpoznaje jeden typ tablic rejestracyjnych, czy też większa pojedyncza sieć lepiej poradzi sobie z tymi dwoma typami?

neural-networks image-recognition SF.
źródło

Odpowiedzi:

Nie wiem, jakie funkcje oferujesz swojej sieci neuronowej. Jednak ogólnie wybrałbym jedną sieć neuronową. Wygląda na to, że nie masz żadnych ograniczeń dotyczących zasobów do szkolenia sieci, a jedynym problemem są zasoby podczas stosowania sieci.

Chodzi o to, że prawdopodobnie te dwa problemy mają ze sobą coś wspólnego (np. Oba rodzaje płyt są prostokątne). Oznacza to, że jeśli korzystasz z dwóch sieci, każda musi ponownie rozwiązać ten sam problem (część wspólna). Jeśli używasz tylko jednej sieci, wspólna część problemu wymaga rozwiązania mniejszej liczby komórek / wag, a pozostałe wagi / komórki można wykorzystać do lepszego rozpoznania.

Na koniec, gdybym był na twoim miejscu, spróbowałbym obu. Myślę, że to jedyny sposób, aby być naprawdę pewnym, jakie jest najlepsze rozwiązanie. Mówiąc teoretycznie możliwe jest, że nie uwzględnimy niektórych czynników.

Didam I
źródło