Керування, для Якого
,
де
,
а
В
- Керування, что поклади від стану, у якому перебуває система. Отже, на передостанньому відрізку годині знайдення оптімальне Керування як функція від стану, в якому перебуватіме система на момент годині
.
Повторюючі Цю процедуру, на-му етапі нужно візначіті оптімальне Керування, что задовольняє співвідношенню
(5)
де
В
відповідно до (3). Співвідношення (5) назіваються рекурентной співвідношеннямі Беллмана.
После того, як на последнего етапі буде знайдено значення І оптімальне Керування, то за відомим значенням можна візначіті послідовно,, ...,,, . При цьом Значення відповідає мінімальному значеннях функціонала (4).
наведення алгоритм розв'язання задачі оптимального Керування методом дінамічного програмування можна перенести на загальний випадок задачі Керування з векторна законом руху (1), тоб ЯКЩО,.
3 Принцип оптімальності для задачі оптимального Керування з фіксованім годиною и вільним правимо кінцем
Розглянемо автономну систему
, (6)
з цільовім функціоналом
, (7)
у якому початковий и кінцевій моменти годині и задані, и завдань початковий стан.
починаючих з будь-якого моменту годині, відрізок оптімальної Траєкторії , Від точки до точки такоже є оптимальною траєкторією. p> Відносно початкова відрізка оптімальної Траєкторії до точки можна стверджуваті, что цею відрізок є оптимальною траєкторією, позбав у тому випадка, коли точка фіксована (Наприклад, у багатоточковіх завданнях Керування), тоб коли за умів Припустиме Траєкторія обов'язково винна проходити через точку. Если ж задана Тільки початкова точка, то відрізок оптімальної Траєкторії может и НЕ буті оптимальною траєкторією, тоб может НЕ доставляті оптимальне значення функціоналу (7).
4 Рівняння Беллмана в задачі з фіксованім годиною и вільним правимо кінцем
Розглянемо систему з законом руху (6) i крітерієм оптімальності (2). Початковий стан системи завдань:
, (8)
годину руху відомій, а кінцевій стан - Невідомий. Побудовали таким чином завдання - це завдання з фіксованім годиною и вільним правимо кінцем.
Позначімо через, оптимальний траєкторію, яка відповідає оптимальному Керування. Зафіксуємо Деяк момент годині и відповідну Йому крапку на оптімальній Траєкторії. Відповідно до принципом оптімальності, відрізок Траєкторії від точки до точки є оптимальною траєкторією и надає найменшого Значення функціоналу
В
среди всех Припустиме процесів на відрізку годині з початкових станом, тоб
.
Припустиме, что для будь-якої точки фазового простору и будь-якого моменту годині існує оптимальна Траєкторія з початкових Умова, яка надає найменшого Значення функціоналу. Позначім...