Dla konkretności rozważ LP za rozwiązanie gry dla dwóch graczy o sumie zerowej, w której każdy gracz ma akcji. Załóżmy, że każdy zapis macierzy wypłat ma najwyżej 1 wartość bezwzględną. Dla uproszczenia nie róbmy żadnych założeń sparity.
Załóżmy, że środowisko wykonawcze jest dostępne w celu przybliżenia wartości tej gry.
Jedną z technik przybliżania tej wartości jest metoda aktualizacji multiplikatywnej (w tym kontekście znana jako uczenie się bez żalu). Daje to błąd , gdzie ukrywa współczynniki dziennika.
Nie wiem dokładnie, jak wygląda krajobraz błędów dla najbardziej znanej metody punktu wewnętrznego, ale domyślam się, że błąd jest podobny do .
Multyplikatywnej metody aktualizacji dać błąd, który jest odwrotna wielomian w . Metody punktowe wewnętrzne dają błąd, który znajduje się w postępie geometrycznym małe . Błąd najlepszego z nich z tego powodu powoli maleje, dopóki wewnętrzny punkt nie nadejdzie, po czym błąd nagle spadnie z klifu. Moje instynkty sprzeciwiają się najlepszym możliwym kompromisom czas / błąd, zachowując się w ten sposób.
Moje pytanie :
Czy istnieje algorytm przybliżonego programowania liniowego, który wygładza narożnik krzywej kompromisu czas / błąd? To znaczy, algorytm, który działa co najmniej tak dobrze, jak oba najlepsze dla dowolnej wartości dostępnego parametru czasu i ma względnie płynny kompromis czas / błąd. Bardziej inteligentnym sposobem na połączenie technik aktualizacji wewnętrznej i multiplikatywnej aktualizacji niż wykorzystanie tych dwóch metod jest jednym z prawdopodobnych sposobów uzyskania takiego algorytmu.
Referencje :
Aktualizacja multiplikatywna ogólnie:
http://www.cs.princeton.edu/~arora/pubs/MWsurvey.pdf
Aktualizacja multiplikatywna dla gier o sumie zerowej:
http://dx.doi.org/10.1016/0167-6377(95)00032-0
Aktualizacja wielokrotna obejmująca / pakująca płyty LP:
http://arxiv.org/PS_cache/arxiv/pdf/0801/0801.1987v1.pdf
Oryginalny papier punktu wewnętrznego:
http://math.stanford.edu/~lekheng/courses/302/classics/karmarkar.pdf
Punkt wewnętrzny z zastosowanej perspektywy matematycznej:
Programowanie nieliniowe Bertsekasa , sekcja 4.1.1.