Po raz pierwszy uruchamiam model LSTM. Oto mój model:
opt = Adam(0.002)
inp = Input(...)
print(inp)
x = Embedding(....)(inp)
x = LSTM(...)(x)
x = BatchNormalization()(x)
pred = Dense(5,activation='softmax')(x)
model = Model(inp,pred)
model.compile(....)
idx = np.random.permutation(X_train.shape[0])
model.fit(X_train[idx], y_train[idx], nb_epoch=1, batch_size=128, verbose=1)
Jaki jest pożytek z gadatliwości podczas trenowania modelu?
python
deep-learning
keras
verbose
rakesh
źródło
źródło
verbose: Integer
. 0, 1 lub 2. Tryb oznajmiania.Verbose = 0 (cichy)
Verbose = 1 (pasek postępu)
Train on 186219 samples, validate on 20691 samples Epoch 1/2 186219/186219 [==============================] - 85s 455us/step - loss: 0.5815 - acc: 0.7728 - val_loss: 0.4917 - val_acc: 0.8029 Train on 186219 samples, validate on 20691 samples Epoch 2/2 186219/186219 [==============================] - 84s 451us/step - loss: 0.4921 - acc: 0.8071 - val_loss: 0.4617 - val_acc: 0.8168
Verbose = 2 (jeden wiersz na epokę)
Train on 186219 samples, validate on 20691 samples Epoch 1/1 - 88s - loss: 0.5746 - acc: 0.7753 - val_loss: 0.4816 - val_acc: 0.8075 Train on 186219 samples, validate on 20691 samples Epoch 1/1 - 88s - loss: 0.4880 - acc: 0.8076 - val_loss: 0.5199 - val_acc: 0.8046
źródło
Dla
verbose
> 0fit
dzienniki metod:Uwaga: jeśli używane są mechanizmy regularyzacji, są one włączone, aby uniknąć nadmiernego dopasowania.
jeśli
validation_data
lubvalidation_split
argumenty nie są puste,fit
dzienniki metod:Uwaga: Mechanizmy regularyzacyjne są wyłączone w czasie testowania, ponieważ wykorzystujemy wszystkie możliwości sieci.
Na przykład używanie
verbose
modelu podczas treningu pomaga wykryć nadmierne dopasowanie, które występuje, gdy twój stan sięacc
poprawia, a stan sięval_acc
pogarsza.źródło
Domyślnie verbose = 1,
verbose = 1, co obejmuje zarówno pasek postępu, jak i jedną linię na epokę
verbose = 0, oznacza milczenie
verbose = 2, jedna linia na epokę, tj. nr epoki / nr ogółem epok
źródło
Kolejność szczegółów podanych z flagą szczegółową jest następująca
Wartość domyślna to 1
W przypadku środowiska produkcyjnego zalecane jest 2
źródło