W raporcie technicznym na temat Galahada [1] autorzy stwierdzają, w kontekście ogólnych problemów programowania nieliniowego,
Naszym zdaniem nigdy tak naprawdę nie było wątpliwości, że metody SQP [sekwencyjnego programowania kwadratowego] odniosą większy sukces [niż metody Augmented Lagrangian] w dłuższej perspektywie ...
Jaka może być podstawa tego przekonania? Tj. Czy są jakieś wyniki teoretyczne, które sugerują, że metody SQP powinny być szybsze / bardziej niezawodne niż metody Augmented Lagrangian?
[1] Galahad, biblioteka bezpiecznych dla wątków pakietów Fortran 90 do nieliniowej optymalizacji na dużą skalę, autorstwa Goulda, Orbana i Tointa
źródło
Jeśli chodzi o zewnętrzne iteracje, SQP powinien wygrać, ponieważ zawiera informacje o drugiej pochodnej, podczas gdy ulepszone metody lagranżańskie, takie jak ADMM, nie.
Należy jednak pamiętać, że każda iteracja tych metod wymaga rozwiązania systemu liniowego, więc aby dokonać rzetelnego porównania, należy wziąć pod uwagę, jak łatwe jest rozwiązanie tych systemów.
W przypadku rozszerzonych metod Lagrange'a (naprzemiennych) każda iteracja, którą rozwiązujesz,
W przypadku metod SQP rozwiązujesz coś w rodzaju gdzie jest Hessem (lub jego przybliżeniem), który jest zwykle dostępny tylko domyślnie pod względem działania na wektory, a jest gradientem. Hesjan zawiera nie tylko , ale także kombinację innych macierzy i odwrotności macierzy pochodzących z linearyzacji ograniczeń i regularyzacji.
Wstępne przygotowanie Hesjan jest dość trudnym przedsięwzięciem i jest znacznie mniej zbadane niż wstępne przygotowanie problemów. Standardową metodą jest przybliżenie odwrotności Hesji za pomocą L-BFGS, ale ma to ograniczoną skuteczność, gdy odwrotność Hesji ma wysoką rangę. Inną popularną metodą jest przybliżenie Hesji jako sumy macierzy niskiej rangi plus macierzy łatwej do odwrócenia, ale ma to również ograniczoną skuteczność w przypadku trudnych problemów. Inne popularne techniki szacowania Hesji oparte są na rzadkich przybliżeniach, ale problemy z ciągłością często mają Hesów, którzy mają słabe przybliżenia.
źródło