2 *, ..., u n *), у результаті реалізації якіх система S за n кроків переходити Із початкових стану X (0) у кінцеве X (k) и при цьом функція (1.1) пріймає найбільше значення.
Принцип оптімальності: Яке б НЕ БУВ стан системи перед Чергова кроком, треба вібрато Керування на цьом кроці так, щоб виграш на даним кроці плюс оптимальний виграш на всех Наступний кроках БУВ максимальним.
Звідсі треба, что Оптимальними стратегію Керування можна здобудуть, ЯКЩО спочатку найти Оптимальними стратегію Керування на n-му кроці, потім на двох останніх кроках, потім на трьох останніх кроках и т.д., аж до Перший Крок. Таким чином, решение Розглянуто Завдання дінамічного програмування доцільно почінаті з визначення оптимального решение на последнего, n-му кроці. Для того щоб найти це решение, мабуть, нужно сделать Різні припущені про ті, як МІГ скінчітіся передостанній крок, І з обліком цього вібрато Керування un0, что Забезпечує Максимальне значення Функції W n (X (n-1) , u n ). Таке Керування un0 Арбітражний процес при ПЄВНЄВ припущені про ті, як скінчіться Попередній крок, назівається умовно оптимальним Керування. Отже, принцип оптімальності вімагає знаходіті на шкірному кроці умовно оптімальне Керування для шкірного з можливіть варіантів попередня Крока.
Щоб це можна Було здійсніті практично, звітність, дати математичне формулювання принципом оптімальності. Для цього введемо деякі додаткові позначені. Позначімо через F n (X 0 ) Максимальний дохід, одержуваній за n кроків при переході системи S з початкових стану X (0) у кінцевій стан X (k) при реалізації оптімальної стратегії Керування U = (u 1 , u 2 , ..., u n ), а через F nk (X (k) ) - максимальний дохід, одержуваній при переході з будь-якого стану X (k) у кінцевій стан X (n) при оптімальній стратегії Керування на что залиша nk кроках. Тоді:
F n (X 0 ) = max [W 1 (X (0) , u < sub> 1 ) + ... + W n (X ( n -1) , u n )] (1.2)
U k + j
(K = 0, n-1) (1.3)
U k +1
Останнє вираженною являє собою математичний запис принципом оптімальності ї звет основного функціонального рівняння Беллмана або рекурентного співвідношення. Вікорістовуючі дяни рівняння можна найти решение Завдання дінамічного програмування. p> думаючи k = n-1 у рекуррентном співвідношенні (1.3), одержимо Наступний функціональне рівняння:
F 1 (X (n-1) = max [W n (X (n-1) sup>, u n ) + F 0 (X (n) )] (1.4)
u n
У цьом рівнянні F ...