Ile parametrów ma pojedynczy zestaw LSTM? Liczba parametrów nakłada dolną granicę na liczbę wymaganych przykładów treningu, a także wpływa na czas szkolenia. Dlatego znajomość liczby parametrów jest przydatna w modelach szkoleniowych z wykorzystaniem LSTM.
deep-learning
rnn
wabbit
źródło
źródło
Jednak w przypadku, gdy Twój LSTM zawiera wektory odchylenia ( jest to domyślne na przykład w keras ), liczba staje się:
źródło
Zgodnie z tym :
Struktura komórki LSTM
Równania LSTM
Wprowadzanie nieliniowości
Jeśli wejściowy x_t ma rozmiar n × 1 i istnieją d komórki pamięci, to rozmiar każdego z W ∗ i U ∗ wynosi d × n , a d × d odpowiednio. Rozmiar W będzie wówczas wynosił 4d × (n + d) . Należy zauważyć, że każda z komórek pamięci dd ma własne wagi W ∗ i U ∗ oraz że jedyne wartości komórek pamięci czasu są współużytkowane z innymi jednostkami LSTM podczas produktu z U ∗ .
Dzięki Arun Mallya za świetną prezentację.
źródło