Экология и безопасность жизнедеятельности стр.106

Экология и безопасность жизнедеятельности стр.106

Прежде чем сформулировать ответ, вернемся к рассматриваемой матрице. Сразу видно, что игроку А выгоднее всего выбрать первую строку, так как все ее элементы больше соответствующих элементов остальных строк. Точно так же игроку В выгоднее всего выбрать второй столбец, так как все элементы этого столбца меньше соответствующих элементов остальных столбцов. Следовательно, в данном примере оптимальными стратегиями будут следующие: для А – выбор первой строки, а для В – выбор второго столбца. Число 4, стоящее на пресечении первой строки и второго столбца, носит название цены игры, т. е. платы, которую получает оптимально играющий игрок. Таким образом, в этом примере гарантированный выигрыш А – не менее 4-х единиц и гарантированный проигрыш В – не более 4-х единиц (он равен 4 единицам, если оба игрока играют оптимально).

Если оказывается, что для данной платежной матрицы минимум в какой-либо строке совпадает с максимумом в каком-либо столбце, то эти строка и столбец называются оптимальными, а их пересечение – седловой точкой платежной матрицы. Соответствующее число и будет ценой игры.

Однако далеко не каждая матрица имеет седловую точку, например, матрица   седловой точки не имеет. Говорить здесь о максимизации наименьшего возможного выигрыша (минимизации наибольшего возможного проигрыша) возможно только при использовании так называемой смешанной стратегии при многократной игре с одной и той же платежной матрицей. Суть этой стратегии заключается в выборе разных стратегий с определенными частотами. Итак, пусть А выбирает первую строку с частотой х, а вторую – с частотой (1 – х). Аналогично для В соответствующие частоты обозначим через у и (1 –у). Тогда средний выигрыш А, обозначаемый через Е (х, у), равен

Е(х,у)=4(1-х)у+х(1-у)=х+4у-5ху.                        (11.17)

Нас интересует величина max min E(x,y). Имеем

x         y

Еу=4-5х,                 (11.18)

откуда Еу>0 при , Ey=0 при х= и Еу<0 при . Значит,

(график на рис. 11.7). Следовательно,

                     (11.19)

 

и оптимальной смешанной  стратегией для А будет выбор первой строки с частотой   и второй строки – с частотой . Средний проигрыш В, обозначаемый F(x,y), очевидно равен –Е (х, у). Нас интересует величина где

F(x,y)=5xy-x-4y.                (11.20)

Имеем Fx=5y-1, откуда Fx< 0 при ,Fx = 0 при y = и Fx>0 при < у ? 1. Значит,

(график на рис. 11.8). Следовательно,

                  ( 11.21)

и оптимальной стратегией для А будет выбор первого столбца с частотой   и второго столбца – с частотой .

При оптимальных смешанных стратегиях выигрыш А и соответственно проигрыш В в пять раз меньше максимально возможного при одиночной игре.

 

Отметим также, что в рассмотренном примере мы показали существование оптимальных стратегий и установили равенство

;                (11.22)

при  этом  величину  Е(х,у)  можно  трактовать как математическое ожидание выигрыша, а величину v = определить как цену игры.


⇐ Предыдущая страница| |Следующая страница ⇒