об показник ефективності Z k +1 досягав максимального значення, рівного. Залишається вибрати управління. Його не можна вибирати з умови локальної максимізації показника ефективності на даному k-му кроці, лише б отримати. Такий підхід був би недалекоглядним, оскільки від вибору залежить новий стан, а від останнього - максимально можлива ефективність, яка може бути досягнута в подальшому, тобто величина. Тому необхідно вибирати управління так, щоб воно в сукупності з оптимальним керуванням на наступних кроках (Починаючи з (k +1) - го) призводило б до загального максимуму показника ефективності на n-k +1 кроках, починаючи з k-го до кінця. Це положення в аналітичній формі можна записати у вигляді наступного співвідношення:
(2.2)
Отримав назва основного функціонального рівняння ДП, або рівняння Беллмана. p> З рівняння (5) може бути отримана функція, якщо відома функція; аналогічно можна отримати, якщо знайдена, і т.д., поки не буде визначена величина, представляє за визначенням максимальне значення показника ефективності процесу в цілому:
В
Співвідношення (5) для визначення послідовності функцій через (k = n, n-1, ..., 1) отримали назву основних рекурентних рівнянь Беллмана.
Вирішуючи рівняння (2.2) для визначення умовного максимуму показника ефективності за n-k +1 кроків, починаючи з k-го кроку, визначаємо відповідне оптимальне управління, при якому цей максимум досягається. Це управління також залежить від. Будемо позначати таке управління через і називати умовним оптимальним керуванням на k-му кроці.
Основне значення рівняння (2.2, в якому реалізована ідея динамічного програмування, полягає в тому, що рішення вихідної задачі визначення максимуму функції (1.2) n змінних зводиться до вирішення послідовності n завдань, що задаються співвідношеннями (2.2), кожне з яких є завданням максимізації функції однієї змінної. Ці завдання виявляються взаємопов'язаними, так як в співвідношенні (2.2) при визначенні враховується знайдена при вирішенні попереднього завдання функція.
В
2.2.3 Загальний опис процесу моделювання та побудови обчислювальної схеми динамічного програмування
Загальна задача оптимізації, щоб її можна було описати моделлю ДП повинна відповідати таким умовам:
1. Завдання може інтерпретуватися як n-кроковий процес управління, а показник ефективності процесу може бути представлений в адитивної формі, тобто як сума показників ефективності на кожному кроці.
2. Структура завдання інваріантна щодо числа кроків п, тобто повинна бути визначена для будь-якого n і не залежати від цього числа.
3. На кожному кроці стан системи визначається кінцевим числом s параметрів стану і управляється кінцевим числом r змінних управління, причому s і r не залежать від числа кроків п.
4. Вибір управління на k-му кроці не впливає на попередні кроки, а стан на початку цього кроку є функція тільки передує стану і вибраного на...