W podstawowym uczeniu maszynowym uczymy się następujących „praktycznych zasad”:
a) rozmiar twoich danych powinien być co najmniej 10 razy większy niż rozmiar VC twojego zestawu hipotez.
b) sieć neuronowa z połączeniami N ma wymiar VC około N.
Kiedy więc sieć neuronowa dogłębnie ucząca się mówi, miliony jednostek, czy to oznacza, że powinniśmy mieć, powiedzmy, miliardy punktów danych? Czy możesz rzucić nieco światła na to?
Odpowiedzi:
Zasada praktyczna, o której mówisz, nie może być zastosowana do sieci neuronowej.
Sieć neuronowa ma pewne podstawowe parametry, tj. Jej wagi i obciążenia. Liczba wag zależy od liczby połączeń między warstwami sieci, a liczba błędów zależy od liczby neuronów.
Rozmiar wymaganych danych w dużej mierze zależy od -
Biorąc to pod uwagę, bardziej poprawnym i pewnym sposobem na sprawdzenie, czy model jest nadmiernie dopasowany, jest sprawdzenie, czy błąd weryfikacji jest zbliżony do błędu szkolenia. Jeśli tak, to model działa dobrze. Jeśli nie, model najprawdopodobniej jest nadmiernie dopasowany, co oznacza, że musisz zmniejszyć rozmiar swojego modelu lub wprowadzić techniki regularyzacji.
źródło