Tutaj autorzy twierdzą, że wysiłki stworzenia skalowalnej kwantowej sieci neuronowej przy użyciu zestawu sparametryzowanych bramek uznaje się za nieudane dla dużej liczby kubitów. Wynika to z faktu, że z powodu lematu Levy'ego gradient funkcji w przestrzeniach o dużych wymiarach jest wszędzie prawie zerowy.
Zastanawiałem się, czy ten argument można zastosować również do innych hybrydowych kwantowo-klasycznych metod optymalizacji, takich jak VQE (Variational Quantum Eigensolver) lub QAOA (Quantum Approximate Optimization Al Algorytm).
Co myślisz?
Odpowiedzi:
Po pierwsze : praca odnosi się do [ 37 ] lematu Levy'ego, ale nie ma wzmianki o „lemie Levy'ego” w [37]. Znajdziesz go nazywano „Levy'ego Nierówność”, który nazywany jest Lemat Levy w to , co jest nie cytowane w dokumencie można wymienić.
Po drugie : istnieje prosty dowód, że twierdzenie to jest fałszywe w przypadku VQE. W chemii kwantowej optymalizujemy parametry funkcji falowej ansatz| Ψ(p⃗ ) ⟩ w celu uzyskania najniższej (tj. najdokładniejszej) energii. Energia jest oceniana przez:
VQE oznacza po prostu, że używamy komputera kwantowego do oceny tej energii, a klasycznego komputera do wyboru, w jaki sposób poprawić parametryp⃗ tak, że energia będzie niższa w następnej iteracji kwantowej.
Tak więc, czy gradient będzie wynosił 0, prawie wszędzie, gdy liczba parametrów wp⃗ jest duży "nie zależy wcale od tego, czy używamy VQE (na komputerze kwantowym), czy po prostu uruchamiamy standardowy program chemii kwantowej (np. Gaussa ) na klasycznym komputerze. Chemicy kwantowi zazwyczaj optymalizują zmiennie powyższą energię z maksymalnie1010 parametry w p⃗ , a jedynym powodem, dla którego nie wykraczamy poza to, jest to, że kończy nam się pamięć RAM, a nie dlatego, że krajobraz energii zaczyna się wyrównywać. W tym artykule można zobaczyć na końcu streszczenia, że obliczyli energię dla funkcji falowej z około1012 parametry , gdzie parametry są współczynnikami wyznaczników Slatera. Powszechnie wiadomo, że krajobraz energetyczny nie jest tak płaski (tak jakby byłby, gdyby gradient wynosił 0 prawie wszędzie), nawet jeśli istnieją tryliony parametrów lub nawet więcej.
Wniosek : Zastosowanie Lemmy Levy'ego będzie zależeć od konkretnego krajobrazu energetycznego, który masz, który będzie zależał od obuH. i twój ansatz | Ψ(p⃗ ) ⟩ . W przypadku ich szczególnej implementacji QNN, stwierdzili, że zastosowanie Lemmy Levy'ego jest odpowiednie. W przypadku VQE mamy kontrprzykład na twierdzenie, że lemat Levy'ego „zawsze” ma zastosowanie. Przeciwnym przykładem, w którym Lemma Levy'ego nie ma zastosowania, jest czasH. jest molekularnym hamiltonianem i| * F⟩ jest funkcją falową CI .
źródło