Pytania oznaczone «rnn»

Powtarzalna sieć neuronowa (RNN) to klasa sztucznych sieci neuronowych, w których połączenia między jednostkami tworzą ukierunkowany cykl.

61
Szkolenie RNN z przykładami różnych długości w Keras

Próbuję zacząć uczyć się o RNN i używam Keras. Rozumiem podstawowe założenie waniliowych warstw RNN i LSTM, ale mam problem ze zrozumieniem pewnej technicznej kwestii szkolenia. W dokumentacji keras napisano, że wejście do warstwy RNN musi mieć kształt (batch_size, timesteps, input_dim). Sugeruje...

43
Liczba parametrów w modelu LSTM

Ile parametrów ma pojedynczy zestaw LSTM? Liczba parametrów nakłada dolną granicę na liczbę wymaganych przykładów treningu, a także wpływa na czas szkolenia. Dlatego znajomość liczby parametrów jest przydatna w modelach szkoleniowych z wykorzystaniem

19
Co oznacza „Liczba jednostek w komórce LSTM”?

Z kodu Tensorflow : Tensorflow. RnnCell. num_units: int, The number of units in the LSTM cell. Nie mogę zrozumieć, co to oznacza. Jakie są jednostki komórki LSTM. Bramy wejściowe, wyjściowe i zapomnienia? Czy to oznacza „liczbę jednostek w rekurencyjnej warstwie projekcyjnej dla Deep LSTM”....

17
powiększ mapę cieplną dna morskiego

Tworzę plik corr()df z oryginalnego pliku df. corr()Df wyszedł 70 x 70 i to jest niemożliwe, aby wyobrazić sobie mapę cieplną ... sns.heatmap(df). Jeśli spróbuję wyświetlić corr = df.corr(), tabela nie pasuje do ekranu i widzę wszystkie korelacje. Czy jest to sposób na wydrukowanie całości dfbez...

14
RNN przy użyciu wielu szeregów czasowych

Próbuję utworzyć sieć neuronową, używając szeregów czasowych jako danych wejściowych, aby trenować ją w oparciu o typ każdej serii. Czytałem, że używając RNN możesz podzielić dane wejściowe na partie i wykorzystać każdy punkt szeregu czasowego na poszczególne neurony i ostatecznie wyszkolić...

13
Zapomnij o warstwie w rekurencyjnej sieci neuronowej (RNN) -

Próbuję obliczyć wymiary każdej zmiennej w RNN w warstwie zapomnienia, jednak nie jestem pewien, czy jestem na dobrej drodze. Następne zdjęcie i równanie pochodzi z postu na blogu Colah „Understanding LSTM Networks” : gdzie: oznacza wielkośćwektora m ∗ 1xtxtx_tm∗1m∗1m*1 jest ukrytym stanem...

12
Ile komórek LSTM powinienem użyć?

Czy istnieją jakieś praktyczne zasady (lub rzeczywiste zasady) dotyczące minimalnej, maksymalnej i „rozsądnej” liczby komórek LSTM, których powinienem użyć? W szczególności odnoszę się do BasicLSTMCell z TensorFlow i num_unitswłasności. Załóżmy, że mam problem z klasyfikacją zdefiniowany przez: t...

11
Czy są jakieś dobre gotowe modele językowe dla Pythona?

Prototypuję aplikację i potrzebuję modelu językowego, aby obliczyć zakłopotanie w przypadku niektórych wygenerowanych zdań. Czy istnieje jakiś wyuczony model języka w Pythonie, którego można łatwo używać? Coś prostego jak model = LanguageModel('en') p1 = model.perplexity('This is a well...

11
Porzucasz na jakich warstwach LSTM?

Używając wielowarstwowej LSTMz usuwaniem, czy wskazane jest umieszczenie zrzutu na wszystkich ukrytych warstwach, a także na wyjściowych warstwach gęstych? W artykule Hintona (który zaproponował Dropout) umieścił Dropout tylko na gęstych warstwach, ale to dlatego, że ukryte wewnętrzne warstwy były...

10
Keras LSTM z szeregami czasowymi 1D

Uczę się, jak korzystać z Keras i osiągnąłem znaczny sukces z moim oznaczonym zestawem danych, korzystając z przykładów z głębokiego uczenia się dla Pythona przez Cholleta . Zestaw danych to ~ 1000 szeregów czasowych o długości 3125 z 3 potencjalnymi klasami. Chciałbym wyjść poza podstawowe...

10
Model cykliczny (CNN) na danych EEG

Zastanawiam się, jak interpretować architekturę cykliczną w kontekście EEG. W szczególności myślę o tym jako o Rekurencyjnym CNN (w przeciwieństwie do architektur takich jak LSTM), ale może dotyczy to również innych typów sieci rekurencyjnych Kiedy czytam o R-CNN, są one zwykle wyjaśniane w...