Nauka danych

13
Jak należy inicjalizować i regulować uprzedzenie?

Przeczytałem kilka artykułów na temat inicjalizacji jądra i wiele artykułów wspomina, że ​​używają regulowania L2 jądra (często z ).λ = 0,0001λ=0,0001\lambda = 0.0001 Czy ktoś robi coś innego niż inicjowanie błędu systematycznego zerowym i nieregulowanie go? Dokumenty inicjujące jądro Mishkin...

13
Zapomnij o warstwie w rekurencyjnej sieci neuronowej (RNN) -

Próbuję obliczyć wymiary każdej zmiennej w RNN w warstwie zapomnienia, jednak nie jestem pewien, czy jestem na dobrej drodze. Następne zdjęcie i równanie pochodzi z postu na blogu Colah „Understanding LSTM Networks” : gdzie: oznacza wielkośćwektora m ∗ 1xtxtx_tm∗1m∗1m*1 jest ukrytym stanem...

13
Co to jest osadzanie wykresów?

Ostatnio natknąłem się na osadzanie wykresów, takie jak DeepWalk i LINE. Jednak nadal nie mam jasnego pojęcia, co oznacza osadzanie wykresów i kiedy go używać (aplikacje)? Wszelkie sugestie są mile