W przypadku następującego problemu
następujące ograniczenia
gdzie:
: Zużycie w czasie
: Bogactwo finansowe w czasie
: Dochód w czasie
: Nominalna stopa procentowa w czasie
: Oczekiwany dochód w czasie
Weź pod uwagę, że jest zdefiniowana przez funkcję narzędzia izoelastycznego:
Znajdź optymalną funkcję polityki dla .
Nie wiem, jak napisać równanie Bellmana, ponieważ mam dwa ograniczenia. Jaka byłaby optymalna procedura rozwiązania tego problemu?
dynamic-programming
bellman-equations
Renzo GA
źródło
źródło
Odpowiedzi:
„Drugie” ograniczenie wydaje się zbędne i dezorientuje sprawy. Ponownie umów pierwszy, który chcesz uzyskać
To mówi nam, że bogactwo na początku następnego okresu jest w pełni determinowane decyzjami obecnego okresu i znanymi stanami, bez jakiejkolwiek niepewności: zaczynamy od danego bogactwa na początku tego okresu, nasze dochody i stopa procentowa stają się znane, decydujemy i „odkładamy” pełną kwotę zużycia (na cały okres na początku okresu), a reszta staje się oprocentowanym aktywem.
Dlaczego drugie ograniczenie, które patrzy w przyszłość, myli sprawy? Ponieważ w celu zastosowania równania programowania dynamicznego / Bellmana musi być tak, że nasz problem optymalizacji można sformułować jako rekurencyjny , co oznacza, że cały problem wielu okresów, a nawet problem nieskończonego horyzontu, można rozbić na dwa problem z okresem. I mamy ten warunek w powyższym ograniczeniu, nie potrzebujemy drugiego.
Jeśli jest funkcją wartości, równanie Bellmana jest wtedyV(a~t)
i musimy znaleźć funkcję strategii która spełniah(a~t)=c~t
źródło