стратегії <# «84» src=«doc_zip53.jpg» />
Величина v невідома, однак можна вважати, що ціна гри v> 0. Остання умова виконується завжди, якщо всі елементи платіжної матриці невід'ємні, а цього можна досягти, додавши до всіх елементів матриці деяке позитивне число.
Перетворимо систему обмежень, розділивши всі члени нерівностей на v.
(4)
Де
,. (5)
За умовою x1 + x2 + ... + xm=1.
Розділимо обидві частини цієї рівності на v.
.
Оптимальна стратегія (x1, x2, ..., xm) гравця А повинна максимізувати величину v, отже, функція
(6)
повинна приймати мінімальне значення.
Таким чином, отримана задача лінійного програмування: знайти мінімум цільової функції (6) при обмеженнях (4), причому на змінні накладено умова позитивності (5). Вирішуючи її, знаходимо значення, і величину 1 / v, потім відшукуються значення xi=vti.
Аналогічно для другого гравця оптимальна стратегія опт повинна забезпечити за будь-яких стратегіях першого гравця програш, що не перевищує ціну гри.
,.
Для завдання відшукання оптимальної стратегії гравця B мають місце обмеження
Перетворимо систему обмежень, розділивши всі члени нерівностей на v.
(7) де,. (8)
За умовою y 1 + y 2 + ... + yn=1. Розділимо обидві частини цієї рівності на v. .
Оптимальна стратегія (y 1, y 2, ..., yn) гравця В повинна мінімізувати величину v, отже, функція
(9)
повинна приймати максимальне значення.
Отримано завдання лінійного програмування <# «justify"> 2.5 Ігри з природою
У розглянутих вище матричних іграх <# «84» src=«doc_zip72.jpg» />.
Нехай гравець А має стратегії А1, А2, ..., А m, а природа - стану В1, В2, ..., Вn. Найбільш простою є ситуація, коли відома ймовірність pj кожного стану природи В j. При цьому, якщо враховані всі можливі стану, p1 + p2 + ... + pj + ... + pn=1.
Якщо гравець А вибирає чисту стратегію Аi, то математичне сподівання виграшу складе p1 ai1 + p2 ai2 + ... + pn ain. Найбільш вигідною буде та стратегія, при якій досягається
(p1 ai1 + p2 ai2 + ... + pn ain).
Якщо інформація про стани з природою мала, то можна застосувати принцип недостатнього підстави Лапласа, згідно з яким можна вважати, що всі стани природи равновероятностних:
,
тобто стратегію, для якої середнє арифметичне елементів відповідного рядка максимальне.
Є ряд критеріїв, які використовуються при виборі оптимальної стратегії.
1. Критерій Вальда. Рекомендується застосовувати максимина стратегію <# «28» src=«doc_zip75.jpg» />
і збігається з нижньою ціною гри. Критерій є песимістичним, вважається, що природа буде діяти найгіршим для людини способом.
. Критерій максимуму. Він вибирається з умови
.
Критерій є оптимістичним, вважається, що природа буде найбільш сприятлива для людини.
. Критерій Гурвіца. Критерій рекомендує стратегію, яка визначається за формулою:
...