Wypukłość
Funkcja f(x) z x∈X jest wypukły, jeśli w ogóle x1∈X, x2∈X i dla każdego 0≤λ≤1,
f(λx1+(1−λ)x2)≤λf(x1)+(1−λ)f(x2).
Można udowodnić, że takie wypukłe f(x)ma jedno globalne minimum. Unikalne globalne minimum eliminuje pułapki tworzone przez lokalne minima, które mogą wystąpić w algorytmach, które próbują osiągnąć zbieżność na globalnym minimum, takim jak minimalizacja funkcji błędu.
Chociaż funkcja błędu może być w 100% niezawodna we wszystkich ciągłych, liniowych kontekstach i wielu kontekstach nieliniowych, nie oznacza to zbieżności globalnego minimum dla wszystkich możliwych kontekstów nieliniowych.
Średni błąd kwadratowy
Biorąc pod uwagę funkcję s(x) opisujący idealne zachowanie systemu i model systemu a(x,p) (gdzie p to wektor parametru, macierz, sześcian lub hipersześcian i 1≤n≤N), utworzonych racjonalnie lub poprzez konwergencję (jak w treningu sieci neuronowej), funkcję błędu średniego kwadratu (MSE) można przedstawić w następujący sposób.
e(β):=N−1∑n[a(xn)−s(xn)]2
Materiał, który czytasz, prawdopodobnie tego nie twierdzi a(x,p) lub s(x) są wypukłe w stosunku do x, ale to e(β) jest wypukły w stosunku do a(x,p) i s(x)bez względu na to, jakie są. To późniejsze stwierdzenie można udowodnić dla dowolnej ciągłościa(x,p) i s(x).
Mylący algorytm konwergencji
Jeśli pytanie brzmi, czy konkretny a(x,p) i sposób osiągnięcia s(x) która jest zbliżona do a(x,p)w granicach rozsądnego marginesu konwergencji MSE można pomylić, odpowiedź brzmi „tak”. Dlatego MSE nie jest jedynym modelem błędu.
Podsumowanie
Najlepszym sposobem podsumowania jest to e(β) należy zdefiniować lub wybrać z zestawu podstawowych modeli wypukłych błędów opartych na poniższej wiedzy.
- Znane właściwości systemu s(x)
- Definicja modelu aproksymacyjnego a(x,p)
- Tensor służy do generowania następnego stanu w zbieżnej sekwencji
Zestaw podstawowych modeli wypukłych błędów z pewnością obejmuje model MSE ze względu na jego prostotę i oszczędność obliczeniową.