Żal wewnętrzny w Online Convex Optimization

19

„Optymalizacja wypukła” Zinkevicha ( http://www.cs.cmu.edu/~maz/publications/ICML03.pdf ) uogólnia algorytmy uczenia się „minimalizacji żalu” od ustawień liniowych do wypukłych i daje dobre „zewnętrzne pożałowanie” . Czy istnieje podobne uogólnienie wewnętrznego żalu? (Nie jestem do końca pewien, co to właściwie znaczy.)

lg.learning online-learning Noam
źródło

Czy do pytania można dodać krótki opis wewnętrznego żalu?

Moritz,

W zwykłym „ekspercie” ustawienie wewnętrznego żalu oznaczałoby, że z perspektywy czasu nie chciałbyś zmieniać jednej akcji na drugą, konsekwentnie w całej historii. Artykuł Blum-Mansour jest prawdopodobnie najlepszym odniesieniem do wewnętrznego i zewnętrznego żalu: jmlr.csail.mit.edu/papers/volume8/blum07a/blum07a.pdf

Noam

9

Spróbuj „Bez żalu uczenie się w wypukłych grach” Gordona, Greenwalda i Marksa http://portal.acm.org/citation.cfm?id=1390202 . Jego streszczenie brzmi, jakby prawdopodobnie odpowiadało na twoje pytanie, a przynajmniej ktoś odpowiadający na to pytanie zacytowałby lub zacytowałby ten artykuł.

Warren Schudy
źródło

0

Ten artykuł Avrim Blum wskazuje na związek między żalem zewnętrznym i wewnętrznym. Zgodnie z jego streszczeniem, externa żal jest miarą tego, jak zły algorytm jest porównywany z najlepszym ustalonym działaniem, podczas gdy wewnętrzny żal porównuje się z najlepszą odmianą tej metody (najlepsza stała permutacja wyników, jak raportowanie klasy A, ilekroć zgłaszany jest oryginalny algorytm klasa B).

Alexandre Passos
źródło

1

Artykuł Blum-Mansour nie znajduje się w ustawieniu „optymalizacja wypukła online”, ale raczej w ustawieniu liniowym „eksperci”. Moje pytanie brzmi, czy w ustawieniu wypukłym można zastosować coś podobnego lub jakiś inny bezpośredni algorytm wewnętrznego żalu.

Noam

Żal wewnętrzny w Online Convex Optimization

Odpowiedzi: