уваний виграш гравця 1 в k послідовних реалізаціях при початкових ресурсах A і B і використанні оптимальної політики.
Нехай загальний початковий ресурс гравців A + B=C і гра продовжується до розорення одного з гравців. Позначимо через F (A) очікувану ймовірність виживання (шанси не розоритися) гравця 1 при його початковому ресурсі А та оптимальної політиці обох гравців.
Тоді
(A і 0)=0, (A Ј C)=1.
Чи гра не володіє сідловою в просторі чистих стратегій, то оптимальні значення ймовірностей використання виборів відповідають внутрішнім точкам безлічі планів (0 lt; P lt; 1, 0 lt; Q lt; 1) і напрошується думка вдатися до апарату похідних.
Приклад. Розглянемо гру на виживання з матрицею при повному капіталі гравців С=4.
Тут в силу целочисленности даних беремо цілочисельні значення А від 0 до 4. ecли позначити ймовірності відповідних виборів гравців через P, 1-P, Q, 1-Q, то F (A Ј 0)=0 , F (A і 4)=1,
Відшукуємо приватні похідні і будуємо системи рівнянь для пошуку оптимальних значень P (A), Q (A):
Рішення наведених систем дає
Підставляючи отримані вирази в вихідні вирази функцій, маємо
Вирішуючи отриману нелінійну систему, маємо оцінки (1)=0.3, F (2)=0.5, F (3)=0.7
і (1)=0.41, P (2)=0.5, P (3)=0.59, Q (1)=0.41, Q (2)=0.3, Q (3)=0.41.
. Багатокрокові гри. Ігри погоні
Найпростішим прикладом таких ігор може служити завдання для двох гравців, що розташувалися на прямій на відстані d. На кожному кроці гри гравці можуть одночасно зміщуватися вліво або вправо при повної інформації про позиції один одного Після чергового кроку гравець 2 сплачує гравцеві 1 величину G (S), де S - відстань між ними. З вірогідністю A (d) гра може бути продовжена і з імовірністю 1-A (d) закінчена.
Якщо позначити через P1, P2, Q1, Q2 ймовірності зміщення гравців в ту чи іншу сторону, то одна з можливих формулювань задачі має вигляд
Істотно більший інтерес може представити гра погоні на площині або в просторі, де встановлюється принципова можливість упіймання одного гравця іншим або відшукується траєкторія, що мінімізує час затримання. Ці ігри відносяться до т.зв. безперервним багатокроковим іграм, рішення яких зводиться до дискретним моделям
. Статистичні рішення. Основні поняття
Теорія статистичних рішень може бути витлумачена як теорія пошуку оптимального недетермінірованного поведінки в умовах невизначеності. Сучасна концепція статистичного рішення висунута А.Вальдом і вважає поведінку оптимальним, якщо воно мінімізує ризик в послідовних експериментах, тобто математичне очікування збитків статистичного експерименту. У такій постановці будь-яка задача статистичних рішень може розглядатися як гра двох осіб, в якій одним з гравців є природа .
Вибір найкращих рішень в умовах неповної інформації є одним з основних занять людей.
Збираючись в туристичний похід, ми укладаємо речі в рюкзак з урахуванням невідомої погоди і переслідуємо мету отримати максимум задоволень, не перетворюючись на рекордсмена по перенесенні ваги.
Проектуючи гідротехнічні споруди, ми прагнемо зробити їх надійними, незважаючи на непередбачувані землетрусу, паводки тощо.
Створюючи систему профілактичних та аварійних ремонтів, ми переслідуємо якусь мету, не знаючи в точності часу виникнення аварій.
Якщо процес визначається повторюваними ситуаціями, то його усереднені характеристики відчувають тенденцію до стабілізації і з'являється можливість або заміни випадкового процесу детермінованим, або використання якихось методів дослідження стаціонарних випадкових процесів (зокрема, методів теорії масового обслуговування).
Однак більшість процесів характеризується дурний невизначеністю і неможливо знайти закони розподілу та інші імовірнісні характеристики. У таких ситуаціях доводиться вдатися до експертними оцінками.
Виникає і проблема вибору критерію оптимальності, оскільки рішення, оптимальне для якихось умов, буває неприйнятним в інших і доводиться шукати певний компроміс.
Нехай заданий деякий вектор S=(S1, S2, .., Sn), що описує n станів зовнішнього середовища, і вектор X=(X1, X2, .., Xm), що описує m допустимих рішень. Потрібно знайти вектор X *=(0,0, .., 0, Xi, 0, .., 0), який забезпечує оптимум деякої функції корисності W (X, S) за деяким критерієм K.
Інформація oб зазн...