ньому управління (відсутність післядії).
Побудова моделі ДП зводиться до наступних основних моментів:
1) вибирають спосіб розподілу процесу на кроки;
2) вводять параметри стану і змінні управління на кожному кроці процесу;
3) записують рівняння стану
(3.1)
4) вводять показники ефективності на k-му кроці і сумарний показник - цільову функцію
(3.2)
5) вводять в розгляд умовні максимуми показника ефективності від k-гo кроку (включно) до кінця процесу і умовні оптімальниеуправленія на k-му кроці
6) з обмежень завдання визначають для кожного кроку безлічі D k допустимих управлінь на цьому кроці;
7) записують основні для обчислювальної схеми ДП функціональні рівняння Беллмана
(3.3)
(3.4)
Незважаючи на однаковість у загальній побудові моделі ДП, наведеному вище, обчислювальна схема будується залежно від розмірності задачі, характеру моделі (Дискретної чи безупинної), виду функцій (3.1), (3.2) та інших характеристик моделі. При всій різноманітності обчислювальних схем ДП можна відзначити в них деякі спільні риси.
1. Рішення рівнянь (3.3) проводять послідовно, починаючи з (3.4). Цей етап отримав назва умовної оптимізації.
2. Внаслідок послідовного вирішення п приватних завдань на умовний максимум визначають дві послідовності функцій:-умовні максимуми і відповідні їм-умовні оптимальні управління.
3. Зазначені послідовності функцій в дискретних завданнях отримують в табличній формі, а в безперервних моделях їх можна отримати аналітично.
4. Після виконання першого етапу (умовної оптимізації) приступають до другого етапу - безумовної оптимізації.
а) Якщо початковий стан задано,
то безпосередньо визначають максимум цільової
функції
p> (3.5)
а потім - шукане безумовне оптимальне управління по ланцюжку
(3.6)
У цій ланцюжку перехід, зазначений суцільною лінією, проводять по послідовності, а пунктирною - за допомогою рівнянь станів.
б) Якщо задано безліч початкових станів,
, То додатково вирішують ще одну задачу на максимум:
(3.7)
звідки знаходять, а потім, як і в п. а), по ланцюжку (3.6)-безумовне оптимальне керування.
Іноді на етапі умовної оптимізації обчислювальний процес зручно будувати в напрямку, зворотному описаного вище, тобто від 1-го кроку до л-му. Цей спосіб одержав назва прямого ходу обчислень в відміну від вищевикладеного, який називається зворотним ходом. Рівняння станів для прямого ходу зручно записувати у вигляді
(3.8)
Вони можуть бути отримані рішенням рівнянь (1.1) відносно. Введемо в розгляд умовні максимуми показника ефективності за k кроків, від 1-го до k-го включно - величини. Повторивши міркування п. 2.2.2., Прийдемо до наступної форми рівнянь Беллмана:
p> (3.9)
(3....