Prowadzę zajęcia z analizy numerycznej i szukam motywacji do metody BFGS dla studentów z ograniczonym zapleczem / intuicją w optymalizacji!
Chociaż nie mam czasu, aby rygorystycznie udowodnić, że wszystko się zbiega, staram się uzasadnić, dlaczego może pojawić się aktualizacja Hesji BFGS. Analogicznie, metodę znalezienia root Broydena (mój opis jest tutaj ) można zmotywować, prosząc, aby twoje obecne przybliżenie jakobianów minimalizowało różnicę ze starym jakobianem z zastrzeżeniem, że bierze ono pod uwagę najnowszą secant : J_k (\ vec x_k- \ vec x_ {k-1}) = f (\ vec x_k) -f (\ vec x_ {k-1 }) .
Pochodne aktualizacji BFGS wydają się o wiele bardziej zaangażowane i mętne! W szczególności nie chciałbym zakładać z góry, że aktualizacja powinna mieć rangę 2 lub przyjąć określoną formę. Czy istnieje krótka motywacja wyglądająca na wariację dla aktualizacji BFGS w Hesji, jak ta dla Broydena?
źródło
Odpowiedzi:
Wyprowadzenie BFGS jest bardziej intuicyjne, gdy weźmie się pod uwagę (ściśle) funkcjonały wypukłego kosztu:
Jednak niektóre t informacje niezbędne jest: Załóżmy chce się minimalizować wypukłą funkcjonalny Powiedz, że istnieje przybliżone rozwiązanie . Następnie przybliżamy minimum do minimum obciętego rozszerzenia Taylora Oznacza to, że szuka się takiego, że jest minimalne i ustawia . Obliczenie gradientu - „względem ” - i ustawienie go na zero daje relację H ( x k ) [ x k + 1 - x k ] = ∇ f ( x k + 1 ) - ∇ f ( x k ) , H
Ponieważ obliczenia i inwersja Hesjan są drogie ...
... krótka odpowiedź
(por. aktualizacja Broydena) może być tak, że aktualizacja BFGS minimalizuje w inteligentnie wybranej ważonej normie Frobeniusa, z zastrzeżeniemH.- 1k + 1
Następnie wybór masy wW. ∥ H.∥W.: = ∥ W.1 / 2H.W.1 / 2∥fa
G : = ∫10H.( xk+ τp ) dτ αk= 1
jako odwrotnośćuśrednionego Heskiego , por. tutaj dla instrukcji, ale bez dowodu, podaje formułę aktualizacji BFGS (z ).Główne punkty to:
Już odpowiedź powinna zawierać jak wybrać wagi, jak do tej pracy za problemy nonconvex (gdzie pojawia się krzywizny stan, który wymaga skalowania kierunku szukaj ), i jak czerpać rzeczywistego wzoru na aktualizację. Referencje znajdują się tutaj (w języku niemieckim).p
źródło