Jaka jest złożoność czasu na szkolenie sieci neuronowej z wykorzystaniem propagacji wstecznej?

Załóżmy, że zawiera NN nnn ukryte warstwy mmm przykładami treningu, xxx funkcje, a ninin_i węzłów w każdej warstwie. Jaka jest złożoność czasu, aby trenować ten NN przy użyciu propagacji wstecznej? Mam podstawowe pojęcie o tym, jak znajdują złożoność czasową algorytmów, ale tutaj należy wziąć pod...