Dlaczego iteracyjne rozwiązywanie równań Hartree-Focka prowadzi do zbieżności?

10

W metodzie samodzielnego pola Hartree-Focka rozwiązywania niezależnego od czasu elektronicznego równania Schroedingera dążymy do zminimalizowania energii stanu podstawowego, , układu elektronów w polu zewnętrznym w odniesieniu do wyboru orbitali spinowych, { χ i } .E0{χi}

Czynimy to poprzez iteracyjne rozwiązywanie 1 elektronów Hartree-Focka gdzie x i jest wirowanie / przestrzenne współrzędna elektronów I , ε jest wartością własną orbitalnych f I jest operatorem Focka (operator 1 elektronów), przy czym forma f I = - 1

f^iχ(xi)=εχ(xi)
xiiεf^i (sumowania biegnie nad jądrami tutaj, zZjest ładunek nuklearny na jądro A irioznacza odległość pomiędzy elektronówIi jądrzeA). V H F i jest średnim potencjałem odczuwanym przez elektronize względu na wszystkie inne elektrony w układzie. PonieważV H F i zależy od orbitali spinowych,χj
f^i=12i2A=1MZAriA+ViHF
ZAriAiAViHFiViHFχj, z innych elektronów, możemy powiedzieć, że operator Focka jest zależny od jego funkcji własnych. W „Modern Quantum Chemistry” A. Szabo i N. Ostlunda, str. 54 (pierwsze wydanie) piszą, że „równanie Hartree-Focka (2.52) jest nieliniowe i musi być rozwiązane iteracyjnie” . W ramach moich badań przestudiowałem szczegóły tego iteracyjnego rozwiązania, ale w przypadku tego pytania uważam, że są one nieistotne, z wyjątkiem określenia podstawowej struktury metody, którą jest:
  1. Odgadnij początkowo orbitale spinowe, i oblicz V H F i .{χi}ViHF
  2. Rozwiąż powyższe równanie wartości własnej dla tych orbitali spinowych i uzyskaj nowe orbitale spinowe.
  3. Powtarzaj ten proces z nowymi spinowymi orbitami, aż do osiągnięcia spójności.

W tym przypadku samo-konsystencji gdy spin-orbit, które są stosowane do są takie same jak te uzyskane w rozwiązywaniu wartości własnej równanie.ViHF

Moje pytanie brzmi: skąd możemy wiedzieć, że ta konwergencja nastąpi? Dlaczego funkcje własne kolejnych iteracyjnych rozwiązań w pewnym sensie „poprawiają” się w kierunku zbieżnego przypadku? Czy nie jest możliwe, że rozwiązanie może się różnić? Nie rozumiem, jak można temu zapobiec.

Jako kolejne pytanie chciałbym dowiedzieć się, dlaczego zbieżne funkcje własne (spinowe orbitale) dają najlepszą (tj. Najniższą) energię stanu podstawowego. Wydaje mi się, że iteracyjne rozwiązanie równania ma „wbudowaną” zbieżność i minimalizację energii. Być może w równaniach jest wbudowane jakieś ograniczenie, które zapewnia tę zbieżność?

Przesłane z Physics Stack Exchange: https://physics.stackexchange.com/q/20703/why-does-iterative-solving-the-hartree-fock-equations-result-in-convergence

James Womack
źródło
Publikowanie krzyżowe nie jest zalecane w witrynach Stack Exchange.
aeismail

Odpowiedzi:

7

Równania Hartree-Focka są wynikiem wykonywania ograniczonej minimalizacji energii Newtona-Raphsona w odniesieniu do przestrzeni parametrów wyznaczników Slatera (nie mam pod ręką mojej kopii Szabo-Ostlunda, ale wierzę, że jest to wskazane w pochodna). Dlatego HF-SCF zbiegnie się, jeśli początkowe przypuszczenie znajduje się w regionie wypukłym wokół minimum. Gdzie indziej może się zbiegać lub nie. Konwergencja SCF cały czas zawodzi.

Oddech śmierci
źródło
Mam wrażenie, że metoda SCF jest zbieżna tylko wtedy, gdy (i) funkcja jest dobrze zachowana i (ii) początkowe domysły występują wystarczająco blisko globalnego minimum. Czy zgodziłbyś się z tym?
James Womack
2
Nie musi znajdować się w pobliżu globalnego minimum. Na przykład możesz zostać uwięziony w symetrii z lokalnym minimum, które nie jest globalne. Jeśli funkcja jest źle zachowana, zgadzam się, że najprawdopodobniej nie zbiegniesz się. Zachęcam do wyprowadzenia gradientu i hessianu funkcji energii HF we współczynnikach orbitalnych i porównania ich z macierzą Focka. Książka Nocedal na temat optymalizacji jest świetna do zrozumienia zachowania zbieżności w tym świetle.
Deathbreath
Nawet jeśli zbliżasz się do minimum, nadal możesz mieć problemy z systemami, które mają blisko siebie rozmieszczone minima lub potencjalnie niskie krzywe powierzchnie. W szczególności z mojego doświadczenia, systemy takie jak aktynowce (i zakładam, że lantanowiec) o prawie-zdegenerowanych poziomach i stanach wokół minimum wydają się być trudne, ponieważ twój optymalizator może wielokrotnie przekraczać rzeczywiste minimum. (W tym przypadku przydatne jest tłumienie.)
Aesin
4

Teoria funkcjonalna gęstości (DFT) również stosuje podejście jednocząsteczkowe podobne do Hartree-Focka, chociaż potencjał efektywny jest nieco bardziej zaangażowany. Aby osiągnąć globalne minimum, problem ten jest traktowany jako nieliniowy problem ze stałym punktem, który, jak powiedział Deathbreath , można rozwiązać poprzez ograniczoną minimalizację Newtona-Raphsona . Powszechnym podejściem w społeczności DFT jest stosowanie metody Broydena, która, jeśli jest poprawnie zorganizowana ( J Phys A 17 (1984) L317 ), wymaga tylko dwóch wektorów: bieżącego wejścia i wyjścia. (Zobacz Singh i Nordstrom , s. 91-92, aby uzyskać szybki przegląd tej metody lub Martin, Dodatek L, w celu uzyskania pełniejszego przeglądu powiązanych technik.) Nowsza technika zastosowana w Wien2k próbuje przezwyciężyć trudności związane z konwergencją metodą Broyden poprzez zastosowanie metody wielosekundowej. ( PRB 78 (2008) 075114 , arXiv: 0801.3098 )

rcollyer
źródło
3
Innym podejściem innym niż stosowanie metod quasi-Newtona (Broyden) byłoby również DIIS .
Deathbreath
@Deathbreath, dokładnie. O którym Martin dyskutuje.
rcollyer
0

Można zastosować optymalny algorytm tłumienia ODA w cyklu SCF, aby uzyskać prawdziwy algorytm minimalizacji. Wtedy to zawsze się zbiega. (Warto też przeczytać pokrewne artykuły Erica Cancèsa.)

Toon Verstraelen
źródło