Czy błąd średniej kwadratowej jest zawsze wypukły w kontekście sieci neuronowych?

Wiele zasobów, o których wspomniałem, wspomina, że ​​MSE jest świetny, ponieważ jest wypukły. Ale nie rozumiem jak, szczególnie w kontekście sieci neuronowych. Powiedzmy, że mamy następujące elementy: XXX: zestaw danych szkoleniowych YYY: cele ΘΘ\Theta: zestaw parametrów modelu fΘfΘf_\Theta...