Теория игр. Большая российская энциклопедия

Тео́рия игр, раздел математики, изучающий математические модели принятия решений в конфликтных ситуациях. Под конфликтной ситуацией, или просто конфликтом, понимается ситуация, в которой участвуют различные стороны (называемые игроками), имеющие несовпадающие интересы. Многие явления экономического, социального, правового, военного характера содержат конфликтные ситуации различной сложности, поэтому их математические модели, изучаемые в теории игр, весьма разнообразны.

Классы игр, основные понятия и результаты

Описание конфликтной ситуации в виде игры состоит в указании, кто и как участвует в конфликте, каковы возможные исходы конфликта, а также в какой степени участвующие в конфликте стороны заинтересованы в его исходах. Каждая игра характеризуется множеством игроков $I = \left\{ 1, \ldots, N \right\}$ , семейством множеств $\left\{ X_i\right\}_{i∈I}$ , называемых стратегиями, и семейством функций выигрыша игроков $\left\{ H_i\right\}_{i∈I}$ , заданных на прямом произведении $X = X_1 \times \ldots \times X_N$ и принимающих действительные значения. Игра состоит в выборе каждым из игроков $i ∈ I$ своей стратегии $x_i ∈ X_i$ , в результате игры игрок $i ∈ I$ получает выигрыш $H_i(x_1, \ldots, x_N)$ . Предполагается, что, выбирая стратегию, каждый из игроков стремится получить максимально возможный выигрыш. Предполагается также, что выбор стратегии каждым из игроков неизвестен остальным игрокам, поэтому теорию игр можно рассматривать как теорию принятия решений в условиях неопределённости.

В простейшем случае, когда $N = 2$ и $H_1 = –H_2$ , игра называется антагонистической игрой двух лиц; при этом, если множества стратегий $X_1$ и $X_2$ конечны, $X_1 = \left\{1, \ldots, m\right\}, \;X_2 = \left\{1, \ldots, n\right\}$ , то игра называется матричной игрой, поскольку функцию $H_1$ , называемую функцией выигрыша первого игрока, можно задать $m × n$ матрицей

$H=\begin{bmatrix} h_{11} & ... & h_{1m} \\ & ... & \\ h_{m1} & ... & h_{mn} \end{bmatrix},$ где $h_{ij} = H_1(i, j),\; i = 1,\ldots, m, \: j = 1, \ldots, n$ . Первый игрок может гарантировать себе выигрыш, равный

$v_1=\max_i\: \min_j \:h_{ij},$ выбирая стратегию $i_0$ , при которой функция $\displaystyle\min_j h_{ij}$ принимает максимальное значение. Аналогично, выбирая стратегию $j_0$ , при которой $\displaystyle\max_i h_{ij}$ достигает минимума, второй игрок гарантирует, что его проигрыш не будет превышать
$v_2=\min_j \max_i \:h_{ij}.$ Для любой матричной игры $v_1 ⩽ v_2$ .

Если $v_1 = v_2$ , то пара $(i_0, j_0)$ представляет собой седловую точку матрицы $H$ , то есть для неё выполняются неравенства

$h_{ij_0} ⩽ h_{i_{0}j_{0}} ⩽ h_{i_{0}j}$ при всех $i = 1, \ldots, m,\; j = 1, \ldots, n$ . В этом случае число называется значением (иногда ценой) игры, стратегии $i_0$ и $j_0$ называются оптимальными чистыми стратегиями соответственно первого и второго игроков, пара оптимальных стратегий называется решением игры. Оптимальные чистые стратегии существуют не для всех матричных игр. Если таких стратегий нет, то возможности игроков расширяют и оптимальные стратегии ищут в классе т. н. смешанных стратегий, т. е. в множестве стратегий, являющихся распределениями вероятностей на множествах чистых стратегий; иначе говоря, стратегиями являются распределения $p = (p_1, \ldots, p_m),\; p_i ⩾ 0,\; i=1, \ldots, m,\; p_1 + \ldots + p_m = 1$ , для первого игрока и распределения $q = (q_1, \ldots, q_n),\; q_j ⩾ 0,\; j = 1, \ldots, n,\; q_1 + \ldots + q_n = 1$ , для второго игрока. В качестве выигрыша первого игрока в этом расширении матричной игры рассматривается математическое ожидание выигрыша исходной игры при выборе игроками смешанных стратегий $p$ и $q$
$H(p,q)=\sum_{i=1}^{m}\sum_{j=1}^{n}h_{ij}p_iq_j.$ Основная теорема теории матричных игр, известная как теорема Неймана о минимаксе, утверждает, что в любой матричной игре существуют оптимальные смешанные стратегии $p^*$ и $q^*$ такие, что
$H(p, q^*) ⩽ H(p^*, q^*) ⩽ H(p^*, q)$ для любых $p$ и $q$ , т. е. пара $(p^*, q^*)$ представляет собой седловую точку функции $H(p, q)$ . Величина $v = H(p^*, q^*)$ называется значением (или ценой) игры (в смешанных стратегиях). Справедливы равенства
$v_2=\max_p\: \min_q H(p, q)=\min_q \max_p H(p, q).$ Последнее равенство составляет содержание теоремы о минимаксе, являющейся одной из основных теорем теории игр.

Смысл оптимальных смешанных стратегий состоит в следующем. Пусть игра повторяется $t$ раз и пусть первый игрок выбирает оптимальную смешанную стратегию, т. е. в каждой игре он выбирает чистую стратегию $i$ с вероятностью, $i = 1,\ldots, m$ . Выигрыш первого игрока в каждой игре – случайная величина, математическое ожидание которой конечно. Среднее значение выигрыша $v_t$ за $t$ игр при росте $t$ в силу закона больших чисел и теоремы о минимаксе в пределе будет не меньше цены игры, какую бы смешанную стратегию ни выбрал второй игрок. Это среднее значение будет стремиться к $v$ по вероятности, если второй игрок выберет свою оптимальную смешанную стратегию $q^*$ .

Основные методы нахождения решения матричных игр опираются на использование методов линейного программирования.

Другим большим классом антагонистических игр являются антагонистические игры, называемые играми на единичном квадрате, в которых множества чистых стратегий первого и второго игроков представляют собой сегмент $[0, 1]$ . К игре на единичном квадрате может быть сведена любая антагонистическая игра с множествами стратегий обоих игроков, имеющими мощность континуума. Эти игры задаются функцией выигрыша $K(х, у)$ , определённой на единичном квадрате. Смешанными стратегиями игроков являются функции распределения $F(x)$ и $G(y),\; x ∈ [0,1],\; y ∈ [0,1]$ . При достаточно широких условиях на функцию $K(х, у)$ выигрыш первого игрока при условии, что первый и второй игроки применяют соответственно смешанные стратегии $F$ и $G$ , полагается равным
$K(F,G)=\int_{0}^{1}\int_{0}^{1}K(x,y)\,dF(x)\,dG(y)$ и справедлива теорема о минимаксе

$\max_F\min_G \:K(F, G)=\min_G \max_F K(F, G),$ т. е. существуют значение игры $v$ и оптимальные смешанные стратегии обоих игроков. Существуют игры на единичном квадрате, для которых теорема о минимаксе несправедлива.

Класс игр, в которых игроки применяют свои стратегии однократно и независимо от выбора противника, включает в себя и игры, осуществляемые путём последовательного выполнения ходов участниками. В таких играх выбор стратегии игрока состоит в указании выбора поочерёдно выполняемых ходов на основании сведений, быть может неполных, о предыдущих ходах обоих игроков, т. е. на основании сведений о текущей позиции игры, в которой принимается решение. Такие игры называются позиционными. Если при принятии решения об очередном ходе игроку известны все предыдущие ходы обоих игроков, то такая игра называется игрой с полной информацией.

В качестве примера позиционной игры с полной информацией можно привести шахматы. Т. к. правила выбора хода в любой позиции игры известны, в принципе можно выписать все стратегии обоих игроков в игре и указать результат каждой партии, сведя т. о. эту игру к матричной форме. Теорема Цермело – Неймана утверждает, что все позиционные игры с полной информацией имеют решение в чистых стратегиях. Для шахмат это означает, что если приписать победе первого игрока выигрыш, равный $1$ , ничьей – выигрыш, равный $0$ , и поражению – выигрыш, равный $–1$ , то такая игра имеет значение в чистых стратегиях, равное $1, 0$ или $–1$ , но истинная величина этого значения неизвестна.

Потребности нахождения оптимального управления в конфликтных ситуациях привели к развитию теории позиционных игр с непрерывным временем, называемых дифференциальными играми. В дифференциальной игре предполагается, что движение управляемой системы описывается уравнением
$\frac {dx}{dt}=f(t,x,u,v),$ где $t$ – время, $x$ – фазовый вектор, $f(t, x, u, v)$ – некоторая функция, $u = u(t, x(t))$ и $v = v(t, x(t))$ – управляющие стратегии первого и второго игроков. В момент времени $t$ игроки располагают информацией о текущей позиции $(t, x(t))$ . Выигрыш (плата) в дифференциальной игре задаётся некоторым функционалом $c(x(t),u(t), v(t))$ , первый игрок стремится добиться минимально возможного, а второй – максимально возможного значения функционала. Специфика дифференциальных игр не позволяет ограничить класс допустимых стратегий $u(t, x(t)),\: v(t, x(t))$ гладкими функциями и использовать для нахождения траектории $x(t)$ известные методы теории обыкновенных дифференциальных уравнений. При некоторых условиях на функции, входящие в определение дифференциальной игры, игра имеет значение и оптимальные стратегии. Для нахождения решений дифференциальных игр может быть использовано динамическое программирование.

В случае неантагонистических игр принцип оптимальности трансформируется в требование приемлемости ситуаций. Ситуация (набор стратегий) $x = (x_1,\ldots, x_N)$ в неантагонистической игре называется приемлемой для коалиции (группы игроков) $K ⊂ I$ или, иначе, $K$ -оптимальной, если отклонение игроков из $K$ от своих стратегий не улучшает ситуацию с точки зрения коалиции $K$ . При этом неулучшение может пониматься по-разному: как неувеличение выигрыша для всех игроков, входящих в $K$ ; неувеличение суммарного выигрыша всех игроков из $K$ ; возможность увеличения выигрыша одних игроков из $K$ лишь за счёт уменьшения выигрыша других игроков из $K$ . Для коалиции $K$ ситуация, обладающая последним из перечисленных свойств, называется оптимальной по Парето. Ситуация, приемлемая для каждой коалиции из некоторого набора коалиций $\frak K = {K_1,\ldots, K_m}$ , называется $\frak K$ -устойчивой. Если $\frak K$ состоит из всех отдельных игроков множества $I$ , то $\frak K$ -устойчивая ситуация называется равновесной по Нэшу. Эти понятия находят широкое применение при анализе математических моделей конфликтных ситуаций в экономике.

Исторический очерк

Отдельные соображения по поводу математического описания конфликтных ситуаций высказывались начиная с 17 в. многими учёными. В конкретных играх смешанные стратегии появились в начале 18 в. Ряд по существу теоретико-игровых утверждений в эквивалентной форме был получен в различных разделах математики, например П. Л. Чебышёвым в теории приближения функций. В 1911 г. Э. Цермело описал теоретико-игровой подход к шахматной игре. В 1921 г. Э. Борель ввёл понятие чистых и смешанных стратегий в матричных играх, однако в полном объёме теорему о минимаксе он не доказал. Эта теорема теории матричных игр была доказана Дж. фон Нейманом в 1928 г. Он опубликовал статью «К теории стратегических игр» (1928), содержащую основные идеи современной теории игр, однако до 1944 г. эти идеи не получили широкого распространения. Их детальной разработке посвящена книга Дж. фон Неймана и О. Моргенштерна «Теория игр и экономическое поведение». После выхода этой книги теория игр вошла в число разделов современной математики и стала развиваться как из потребностей её экономических, социальных, правовых, военных и других применений, так и в силу своих внутренних потребностей. Во 2-й половине 20 в. глубокие связи дифференциальных игр с теорией оптимального управления были установлены Л. С. Понтрягиным, подход к дифференциальным играм как к позиционным играм с непрерывным временем разрабатывался российским математиком Н. Н. Красовским. В СССР теория игр развивалась в основном ленинградской школой теории игр, созданной российским математиком Н. Н. Воробьёвым.

Колчин Валентин Федорович. Первая публикация: Большая российская энциклопедия, 2008.