Gamblipedia — Энциклопедия азартных игр

Теория игр: основы, история и применение

📋 Краткое описание
Теория игр — это математическая наука о стратегическом взаимодействии, применяемая в экономике, биологии и информатике. Она изучает, как рациональные игроки принимают решения в условиях конкуренции и сотрудничества. Основные концепции включают равновесие Нэша и различные типы игр.

Теория игр — это изучение математических моделей стратегического взаимодействия. Она находит применение во многих областях социальных наук и широко используется в экономике, логике, системных науках и информатике. Первоначально теория игр рассматривала игры двух лиц с нулевой суммой, где выигрыш одного участника точно уравновешивается проигрышем другого. В 1950-х годах она была расширена на игры с ненулевой суммой и в конечном итоге применена к широкому спектру поведенческих отношений. Сегодня это общий термин для науки о рациональном принятии решений людьми, животными и компьютерами.

Современная теория игр началась с идеи смешанных стратегических равновесий в играх двух лиц с нулевой суммой, доказанной Джоном фон Нейманом (John von Neumann). Его первоначальное доказательство использовало теорему о неподвижной точке Брауэра, которая стала стандартным методом в теории игр и математической экономике. Его работа была дополнена книгой «Теория игр и экономическое поведение» (1944), написанной совместно с Оскаром Моргенштерном (Oskar Morgenstern), где рассматривались кооперативные игры нескольких игроков. Второе издание предоставило аксиоматическую теорию ожидаемой полезности, позволившую математикам и экономистам анализировать принятие решений в условиях неопределённости.

Теория игр активно развивалась в 1950-х годах и была явно применена к эволюции в 1970-х, хотя похожие разработки восходят по крайней мере к 1930-м годам. Теория игр получила широкое признание как важный инструмент во многих областях. Джон Мейнард Смит (John Maynard Smith) был награждён премией Крафорда за применение эволюционной теории игр в 1999 году, а по состоянию на 2020 год пятнадцать теоретиков игр получили Нобелевскую премию по экономике, включая недавно Пола Милгрома (Paul Milgrom) и Роберта Вильсона (Robert B. Wilson).

История

Обсуждения математики игр начались задолго до возникновения современной математической теории игр. Кардано (Cardano) писал об играх случая в «Книге об азартных играх» (Liber de ludo aleae), написанной около 1564 года, но опубликованной посмертно в 1663 году. Под влиянием работ Ферма (Fermat) и Паскаля (Pascal) по проблеме пунктов Гюйгенс (Huygens) разработал концепцию математического ожидания, опубликовав свой труд по азартным играм в 1657 году.

В 1713 году письмо, приписываемое Чарльзу Вальдегрейву (Charles Waldegrave), активному якобиту и дяде британского дипломата Джеймса Вальдегрейва, анализировало игру под названием «le her». Вальдегрейв предложил решение с минимаксной смешанной стратегией для двухлиц версии карточной игры; эта задача теперь известна как проблема Вальдегрейва.

В 1838 году Антуан Огюстен Курно (Antoine Augustin Cournot) предложил модель конкуренции в олигополиях. Хотя он не называл это так, он представил решение, которое является равновесием Нэша в его работе «Исследования математических принципов теории богатства». В 1883 году Жозеф Бертран (Joseph Bertrand) критиковал модель Курно как нереалистичную, предложив альтернативную модель ценовой конкуренции, которая позже была формализована Фрэнсисом Исидором Эджвортом (Francis Ysidro Edgeworth).

В 1913 году Эрнст Цермело (Ernst Zermelo) опубликовал работу об применении теории множеств к теории шахмат, доказав, что оптимальная шахматная стратегия строго определена.

Основание

Работа Джона фон Неймана установила теорию игр как независимую область в начале-середине XX века. Фон Нейман опубликовал свою статью «О теории игр стратегии» в 1928 году. Его оригинальное доказательство использовало теорему о неподвижной точке Брауэра, которая стала стандартным методом. Работа фон Неймана в теории игр достигла кульминации в его книге 1944 года, написанной совместно с Оскаром Моргенштерном. Второе издание этой книги предоставило аксиоматическую теорию полезности, возродившую старую теорию полезности Даниила Бернулли (Daniel Bernoulli) как независимую дисциплину. Эта фундаментальная работа содержит метод поиска взаимно согласованных решений для игр двух лиц с нулевой суммой. Последующие работы сосредоточились в основном на кооперативной теории игр, которая анализирует оптимальные стратегии для групп людей, предполагая, что они могут обеспечить соблюдение соглашений о надлежащих стратегиях.

В своей книге 1938 года и более ранних заметках Эмиль Борель (Émile Borel) доказал теорему о минимаксе для игр двух лиц с нулевой суммой только когда матрица выплат симметрична и предложил решение нетривиальной бесконечной игры (известной как игра Блотто). Борель предположил несуществование смешанных стратегических равновесий в конечных играх двух лиц с нулевой суммой — гипотеза, которая была опровергнута фон Нейманом.

В 1950 году Джон Нэш (John Nash) разработал критерий взаимной согласованности стратегий игроков, известный как равновесие Нэша, применимый к более широкому спектру игр, чем критерий, предложенный фон Нейманом и Моргенштерном. Нэш доказал, что каждая конечная игра n игроков с ненулевой суммой некооперативного типа имеет то, что теперь называется равновесием Нэша в смешанных стратегиях.

Теория игр пережила всплеск активности в 1950-х годах, когда были разработаны концепции ядра, развёрнутой формы игры, фиктивной игры, повторяющихся игр и значения Шепли (Shapley value). В 1950-х годах также произошли первые применения теории игр к философии и политической науке. Появилось первое математическое обсуждение дилеммы заключённого, и математики Меррилл Флуд (Merrill M. Flood) и Мелвин Дрешер (Melvin Dresher) провели эксперимент в рамках исследований корпорации RAND. RAND преследовала эти исследования из-за возможных применений к глобальной ядерной стратегии.

Награждённые достижения

В 1965 году Райнхард Зельтен (Reinhard Selten) ввёл своё решение совершенного равновесия подигры, которое дополнительно уточнило равновесие Нэша. Позже он также ввёл концепцию дрожащей руки. В 1994 году Нэш, Зельтен и Харсаньи (Harsanyi) получили Нобелевскую премию по экономике за вклад в экономическую теорию игр.

В 1970-х годах теория игр была широко применена в биологии, во многом благодаря работе Джона Мейнарда Смита и его эволюционно стабильной стратегии. Кроме того, были введены и проанализированы концепции коррелированного равновесия, дрожащей руки и общего знания.

В 1994 году Джон Нэш был награждён Нобелевской премией по экономике за вклад в теорию игр. Самый известный вклад Нэша в теорию игр — это концепция равновесия Нэша, решение для некооперативных игр, опубликованное в 1951 году. Равновесие Нэша — это набор стратегий, по одной для каждого игрока, такой, что ни один игрок не может улучшить свой выигрыш, в одностороннем порядке изменив свою стратегию.

В 2005 году теоретики игр Томас Шеллинг (Thomas Schelling) и Роберт Ауман (Robert Aumann) последовали за Нэшем, Зельтеном и Харсаньи как лауреаты Нобелевской премии. Шеллинг работал над динамическими моделями, ранними примерами эволюционной теории игр. Ауман внёс больший вклад в школу равновесия, введя укрупнение равновесия и коррелированные равновесия, а также разработав обширный формальный анализ предположения об общем знании и его последствий.

В 2007 году Леонид Гурвиц (Leonid Hurwicz), Эрик Маскин (Eric Maskin) и Роджер Майерсон (Roger Myerson) были награждены Нобелевской премией по экономике «за создание основ теории механизмов». Вклады Майерсона включают концепцию собственного равновесия и важный учебник для аспирантов. Гурвиц ввёл и формализовал концепцию совместимости стимулов.

В 2012 году Элвин Рот (Alvin E. Roth) и Ллойд Шепли (Lloyd S. Shapley) были награждены Нобелевской премией по экономике «за теорию стабильного распределения и практику дизайна рынков». В 2014 году премия досталась теоретику игр Жану Тиролю (Jean Tirole).

Различные типы игр

Кооперативные и некооперативные

Игра является кооперативной, если игроки могут заключать обязывающие соглашения, обеспечиваемые внешней силой (например, через контрактное право). Игра является некооперативной, если игроки не могут формировать альянсы или если все соглашения должны быть самоисполняющимися (например, через достоверные угрозы).

Кооперативные игры часто анализируются в рамках теории кооперативных игр, которая сосредоточена на предсказании того, какие коалиции сформируются, совместных действиях групп и результирующих коллективных выигрышах. Это отличается от некооперативной теории игр, которая сосредоточена на предсказании действий и выигрышей отдельных игроков путём анализа равновесий Нэша.

Теория кооперативных игр обеспечивает высокоуровневый подход, так как описывает только структуру и выигрыши коалиций, тогда как некооперативная теория игр также рассматривает, как стратегическое взаимодействие повлияет на распределение выигрышей. Поскольку некооперативная теория игр более общая, кооперативные игры могут быть проанализированы через подход некооперативной теории игр (обратное неверно), при условии, что сделаны достаточные предположения для охвата всех возможных стратегий, доступных игрокам благодаря возможности внешнего обеспечения кооперации.

Симметричные и асимметричные

Симметричная игра — это игра, в которой каждый игрок получает одинаковый выигрыш при одинаковом выборе. Другими словами, личность игрока не меняет результирующую игру для другого игрока. Многие из обычно изучаемых игр 2×2 являются симметричными. Стандартные представления игры в курицу, дилеммы заключённого и охоты на оленя — все это симметричные игры.

Наиболее часто изучаемые асимметричные игры — это игры, в которых наборы стратегий не идентичны для обоих игроков. Например, ультиматумная игра и аналогично игра диктатора имеют разные стратегии для каждого игрока. Однако возможно, чтобы игра имела идентичные стратегии для обоих игроков, но при этом была асимметричной.

Игры с нулевой суммой и ненулевой суммой

Игры с нулевой суммой (более общо, игры с постоянной суммой) — это игры, в которых выборы игроков не могут ни увеличить, ни уменьшить доступные ресурсы. В играх с нулевой суммой общий выигрыш всех игроков для каждой комбинации стратегий всегда равен нулю (неформально, один игрок выигрывает только за счёт других).

Покер является примером игры с нулевой суммой (игнорируя возможность комиссии казино), потому что один выигрывает ровно столько, сколько проигрывают его противники. Другие игры с нулевой суммой включают игру в монетку и большинство классических настольных игр, включая го и шахматы.

Многие игры, изучаемые теоретиками игр (включая знаменитую дилемму заключённого), являются играми с ненулевой суммой, потому что результат имеет чистые результаты больше или меньше нуля. Неформально, в играх с ненулевой суммой выигрыш одного игрока не обязательно соответствует проигрышу другого.

Кроме того, игры с постоянной суммой соответствуют деятельности, такой как кража и азартные игры, но не фундаментальной экономической ситуации, в которой существуют потенциальные выгоды от торговли. Возможно преобразовать любую игру с постоянной суммой в игру с нулевой суммой (возможно асимметричную), добавив фиктивного игрока (часто называемого «доской»), чьи потери компенсируют чистые выигрыши игроков.

Одновременные и последовательные

Одновременные игры — это игры, в которых оба игрока ходят одновременно, или позже ходящие игроки не знают о действиях ранее ходивших игроков (что делает их фактически одновременными). Последовательные игры (тип динамических игр) — это игры, в которых игроки не принимают решения одновременно, и более ранние действия игрока влияют на результат и решения других игроков. Это не обязательно означает совершенную информацию о каждом действии ранее ходивших игроков; это может быть очень мало информации. Например, игрок может знать, что ранее ходивший игрок не выполнил одно конкретное действие, но не знает, какое из других доступных действий первый игрок фактически выполнил.

Разница между одновременными и последовательными играми отражена в различных представлениях, обсуждённых выше. Часто нормальная форма используется для представления одновременных игр, а развёрнутая форма — для последовательных. Преобразование развёрнутой формы в нормальную форму является односторонним, что означает, что несколько игр в развёрнутой форме соответствуют одной нормальной форме. Следовательно, понятия равновесия для одновременных игр недостаточны для рассуждений о последовательных играх.

Совершенная информация и несовершенная информация

Важное подмножество последовательных игр состоит из игр с совершенной информацией. Игра с совершенной информацией означает, что все игроки в каждый момент игры знают предыдущую историю игры и ходы, ранее сделанные всеми другими игроками. Игра с несовершенной информацией играется, когда игроки не знают все ходы, уже сделанные противником, такие как игра с одновременным ходом. Примеры игр с совершенной информацией включают крестики-нолики, шашки, шахматы и го.

Многие карточные игры — это игры с несовершенной информацией, такие как покер и бридж. Совершенная информация часто путается с полной информацией, которая является похожей концепцией, относящейся к общему знанию последовательности, стратегий и выигрышей каждого игрока на протяжении игры. Полная информация требует, чтобы каждый игрок знал стратегии и выигрыши, доступные другим игрокам, но не обязательно предпринятые действия, тогда как совершенная информация — это знание всех аспектов игры и игроков. Игры с неполной информацией могут быть сведены к играм с несовершенной информацией путём введения «ходов природы».

Байесовская игра

Одно из предположений равновесия Нэша состоит в том, что каждый игрок имеет правильные убеждения о действиях других игроков. Однако существует много ситуаций в теории игр, когда участники не полностью понимают характеристики своих противников. Переговорщики могут не знать оценку своим противником предмета переговоров, компании могут не знать функции затрат своего противника, комбатанты могут не знать силы своего противника, а присяжные могут не знать интерпретацию доказательств коллегой на суде. В некоторых случаях участники могут хорошо знать характер своего противника, но не знать, насколько хорошо их противник знает свой собственный характер.

Байесовская игра означает стратегическую игру с неполной информацией. Для стратегической игры лица, принимающие решения, являются игроками, и каждый игрок имеет набор действий. Основная часть спецификации несовершенной информации — это набор состояний. Каждое состояние полностью описывает набор характеристик, релевантных для игрока, таких как его предпочтения и детали о нём. Должно быть состояние для каждого набора характеристик, которые некоторый игрок считает возможными.

Комбинаторные игры

Игры, в которых сложность поиска оптимальной стратегии вытекает из множественности возможных ходов, называются комбинаторными играми. Примеры включают шахматы и го. Игры, включающие несовершенную информацию, также могут иметь сильный комбинаторный характер, например нарды. Не существует единой теории, рассматривающей комбинаторные элементы в играх. Однако существуют математические инструменты, которые могут решить некоторые конкретные проблемы и ответить на некоторые общие вопросы.

Игры с совершенной информацией изучались в комбинаторной теории игр, которая разработала новые представления, например сюрреальные числа, а также комбинаторные и алгебраические (а иногда и неконструктивные) методы доказательства для решения игр определённых типов, включая «циклические» игры, которые могут привести к бесконечно длинным последовательностям ходов. Эти методы рассматривают игры с большей комбинаторной сложностью, чем те, которые обычно рассматриваются в традиционной (или «экономической») теории игр. Типичная игра, решённая таким образом, — это Hex. Связанная область исследований, черпающая из теории вычислительной сложности, — это сложность игр, которая занимается оценкой вычислительной сложности поиска оптимальных стратегий.

Исследования в области искусственного интеллекта рассматривали как игры с совершенной, так и несовершенной информацией, которые имеют очень сложные комбинаторные структуры (такие как шахматы, го или нарды), для которых не найдены доказуемо оптимальные стратегии. Практические решения включают вычислительные эвристики, такие как альфа-бета отсечение или использование искусственных нейронных сетей, обученных с помощью обучения с подкреплением, которые делают игры более управляемыми на практике.

Дискретные и непрерывные игры

Большая часть теории игр занимается конечными дискретными играми, которые имеют конечное число игроков, ходов, событий, результатов и т. д. Однако многие концепции могут быть расширены. Непрерывные игры позволяют игрокам выбирать стратегию из непрерывного набора стратегий. Например, конкуренция Курно обычно моделируется со стратегиями игроков, являющимися любыми неотрицательными количествами, включая дробные количества.

Дифференциальные игры

Дифференциальные игры, такие как игра непрерывного преследования и уклонения, — это непрерывные игры, в которых эволюция переменных состояния игроков управляется дифференциальными уравнениями. Проблема поиска оптимальной стратегии в дифференциальной игре тесно связана с теорией оптимального управления. В частности, существует два типа стратегий: открытые стратегии находятся с использованием принципа максимума Понтрягина, а замкнутые стратегии находятся с использованием метода динамического программирования Беллмана.

Частный случай дифференциальных игр — это игры со случайным временным горизонтом. В таких играх конечное время является случайной величиной с заданной функцией распределения вероятностей. Поэтому игроки максимизируют математическое ожидание функции стоимости. Было показано, что модифицированная задача оптимизации может быть переформулирована как дисконтированная дифференциальная игра на бесконечном временном интервале.

Эволюционная теория игр

Эволюционная теория игр изучает игроков, которые корректируют свои стратегии с течением времени в соответствии с правилами, которые не обязательно рациональны или дальновидны. В общем случае эволюция стратегий с течением времени в соответствии с такими правилами моделируется как цепь Маркова с переменной состояния, такой как текущий профиль стратегии или то, как игра велась в недавнем прошлом. Такие правила могут включать имитацию, оптимизацию или выживание наиболее приспособленных.

В биологии такие модели могут представлять эволюцию, в которой потомство принимает стратегии своих родителей, и родители, которые играют более успешные стратегии (то есть соответствующие более высоким выигрышам), имеют большее количество потомства. В социальных науках такие модели обычно представляют стратегическую корректировку игроками, которые играют игру много раз в течение своей жизни и, сознательно или бессознательно, иногда корректируют свои стратегии.

Стохастические результаты

Индивидуальные задачи принятия решений со стохастическими результатами иногда рассматриваются как «игры одного игрока». Они могут быть смоделированы с использованием похожих инструментов в связанных дисциплинах теории решений, исследования операций и областях искусственного интеллекта, особенно планирования ИИ (с неопределённостью) и многоагентных систем. Хотя эти области могут иметь разные мотивы, используемая математика по существу одинакова, например использование процессов принятия решений Маркова.

Стохастические результаты также могут быть смоделированы в терминах теории игр путём добавления случайно действующего игрока, который делает «ходы случая» («ходы природы»). Этот игрок обычно не рассматривается как третий игрок в том, что в противном случае является игрой двух игроков, а просто служит для обеспечения броска костей, когда это требуется игрой.

Для некоторых проблем различные подходы к моделированию стохастических результатов могут привести к различным решениям. Например, разница в подходе между процессами принятия решений Маркова и решением минимакса состоит в том, что последний рассматривает наихудший случай из набора враждебных ходов, а не рассуждает в ожидании об этих ходах с учётом фиксированного распределения вероятностей. Подход минимакса может быть выгоден, когда стохастические модели неопределённости недоступны, но также может переоценивать крайне маловероятные (но дорогостоящие) события, резко влияя на стратегию в таких сценариях, если предполагается, что противник может заставить такое событие произойти.

Общие модели, которые включают все элементы стохастических результатов, противников и частичной или шумной наблюдаемости (действий других игроков), также изучались. «Золотым стандартом» считается частично наблюдаемая стохастическая игра, но мало реалистичных проблем вычислительно осуществимы в представлении POSG.

Метаигры

Это игры, в которых игра состоит в разработке правил для другой игры, целевой или предметной игры. Метаигры стремятся максимизировать полезность разработанного набора правил. Теория метаигр связана с теорией механизмов.

Термин анализ метаигры также используется для обозначения практического подхода, разработанного Найджелом Хоардом (Nigel Howard), при котором ситуация рассматривается как стратегическая игра, в которой заинтересованные стороны пытаются реализовать свои цели, используя доступные им варианты. Последующие разработки привели к формулировке анализа конфронтации.

Теория игр среднего поля

Теория игр среднего поля — это изучение стратегического принятия решений в очень больших популяциях небольших взаимодействующих агентов. Этот класс проблем был рассмотрен в экономической литературе Бояном Йовановичем (Boyan Jovanovic) и Робертом Розенталем (Robert W. Rosenthal), в инженерной литературе Питером Кейнсом (Peter E. Caines) и математиками Пьером-Луи Лионсом (Pierre-Louis Lions) и Жан-Мишелем Ласри (Jean-Michel Lasry).

Представление игр

Игры, изучаемые в теории игр, — это хорошо определённые математические объекты. Чтобы быть полностью определённой, игра должна указывать следующие элементы: игроков игры, информацию и действия, доступные каждому игроку в каждой точке принятия решения, и выигрыши для каждого результата. Теоретик игр обычно использует эти элементы вместе с выбранной концепцией решения, чтобы вывести набор равновесных стратегий для каждого игрока таким образом, чтобы при использовании этих стратегий ни один игрок не мог получить прибыль, в одностороннем порядке отклоняясь от своей стратегии. Эти равновесные стратегии определяют равновесие игры — стабильное состояние, в котором либо происходит один результат, либо набор результатов происходит с известной вероятностью.

Большинство кооперативных игр представлены в характеристической функциональной форме, тогда как развёрнутая и нормальная формы используются для определения некооперативных игр.

Развёрнутая форма

Развёрнутая форма может использоваться для формализации игр с временной последовательностью ходов. Игры в развёрнутой форме могут быть визуализированы с использованием деревьев игры. Здесь каждая вершина (или узел) представляет точку выбора для игрока. Игрок указывается номером, указанным у вершины. Линии из вершины представляют возможное действие для этого игрока. Выигрыши указаны в нижней части дерева. Развёрнутая форма может рассматриваться как многоигровое обобщение дерева решений. Для решения любой игры в развёрнутой форме необходимо использовать обратную индукцию. Это включает работу в обратном направлении вверх по дереву игры, чтобы определить, что рациональный игрок сделает в последней вершине дерева, что игрок с предыдущим ходом сделает, учитывая, что игрок с последним ходом рационален, и так далее, пока не будет достигнута первая вершина дерева.

Развёрнутая форма также может охватывать игры с одновременными ходами и игры с несовершенной информацией. Для её представления либо пунктирная линия соединяет различные вершины, чтобы представить их как часть одного информационного набора (то есть игроки не знают, в какой точке они находятся), либо вокруг них проводится замкнутая линия.

Нормальная форма

Нормальная (или стратегическая) форма игры обычно представляется матрицей, которая показывает игроков, стратегии и выигрыши. Более общо она может быть представлена любой функцией, которая связывает выигрыш для каждого игрока с каждой возможной комбинацией действий. В сопровождающем примере есть два игрока; один выбирает строку, а другой выбирает столбец. Каждый игрок имеет две стратегии, которые указаны количеством строк и столбцов. Выигрыши указаны внутри. Первое число — это выигрыш, полученный игроком строки (Игрок 1 в нашем примере); второе — выигрыш для игрока столбца (Игрок 2 в нашем примере).

Когда игра представлена в нормальной форме, предполагается, что каждый игрок действует одновременно или, по крайней мере, не зная о действиях другого. Если игроки имеют некоторую информацию о выборе других игроков, игра обычно представляется в развёрнутой форме.

Каждая игра в развёрнутой форме имеет эквивалентную игру в нормальной форме, однако преобразование в нормальную форму может привести к экспоненциальному увеличению размера представления, что делает его вычислительно непрактичным.

Характеристическая функциональная форма

В теории кооперативных игр характеристическая функция указывает выигрыш каждой коалиции. Происхождение этой формулировки находится в книге Джона фон Неймана и Оскара Моргенштерна.

Формально характеристическая функция — это функция из множества всех возможных коалиций игроков в множество платежей, которая также удовлетворяет условию, что выигрыш пустого множества равен нулю. Функция описывает, сколько коллективного выигрыша набор игроков может получить, сформировав коалицию.

Альтернативные представления игр

Альтернативные формы представления игр используются для некоторых подклассов игр или адаптированы к потребностям междисциплинарных исследований. В дополнение к классическим представлениям игр некоторые из альтернативных представлений также кодируют аспекты, связанные со временем.

Общее и прикладное применение

Как метод прикладной математики, теория игр использовалась для изучения широкого спектра поведения человека и животных. Она была первоначально разработана в экономике для понимания большого набора экономических поведений, включая поведение фирм, рынков и потребителей. Первое использование теоретико-игрового анализа было Антуаном Огюстеном Курно в 1838 году с его решением дуополии Курно. Использование теории игр в социальных науках расширилось, и теория игр была применена к политическому, социологическому и психологическому поведению.

Хотя натуралисты до XX века, такие как Чарльз Дарвин (Charles Darwin), делали утверждения теоретико-игрового типа, использование теоретико-игрового анализа в биологии началось с исследований Рональда Фишера (Ronald Fisher) поведения животных в 1930-х годах. Эта работа предшествует названию «теория игр», но она разделяет много важных особенностей с этой областью. Разработки в экономике позже были применены к биологии в основном Джоном Мейнардом Смитом в его книге 1982 года «Эволюция и теория игр».

Помимо использования для описания, предсказания и объяснения поведения, теория игр также использовалась для разработки теорий этического или нормативного поведения и предписания такого поведения. В экономике и философии учёные применили теорию игр для помощи в понимании хорошего или надлежащего поведения. Теоретико-игровые подходы также были предложены в философии языка и философии науки. Теоретико-игровые аргументы этого типа можно найти ещё у Платона (Plato). Альтернативная версия теории игр, называемая химической теорией игр, представляет выборы игрока как метафорические молекулы химических реагентов, называемые «knowlecules». Химическая теория игр затем вычисляет результаты как решения равновесия системы химических реакций.

Описание и моделирование

Основное использование теории игр — описание и моделирование того, как ведут себя человеческие популяции. Некоторые учёные считают, что, найдя равновесия игр, они могут предсказать, как будут вести себя реальные человеческие популяции, когда столкнутся с ситуациями, аналогичными изучаемой игре. Этот конкретный взгляд на теорию игр подвергался критике. Утверждается, что предположения, сделанные теоретиками игр, часто нарушаются при применении к реальным ситуациям. Теоретики игр обычно предполагают, что игроки действуют рационально, но на практике человеческая рациональность и/или поведение часто отклоняются от модели рациональности, используемой в теории игр. Теоретики игр отвечают, сравнивая свои предположения с теми, которые используются в физике. Таким образом, хотя их предположения не всегда верны, они могут рассматривать теорию игр как разумный научный идеал, аналогичный моделям, используемым физиками. Однако эмпирические работы показали, что в некоторых классических играх, таких как игра сороконожка, игра «угадай 2/3 среднего» и игра диктатора, люди регулярно не играют равновесия Нэша. Идёт постоянный спор о важности этих экспериментов и о том, полностью ли анализ экспериментов охватывает все аспекты соответствующей ситуации.

Некоторые теоретики игр, следуя работе Джона Мейнарда Смита и Джорджа Прайса (George R. Price), обратились к эволюционной теории игр, чтобы разрешить эти проблемы. Эти модели предполагают либо отсутствие рациональности, либо ограниченную рациональность со стороны игроков. Несмотря на название, эволюционная теория игр не обязательно предполагает естественный отбор в биологическом смысле. Эволюционная теория игр включает как биологическую, так и культурную эволюцию, а также модели индивидуального обучения (например, динамику фиктивной игры).

Предписывающий или нормативный анализ

Некоторые учёные рассматривают теорию игр не как предсказательный инструмент для поведения человека, а как предложение о том, как люди должны вести себя. Поскольку стратегия, соответствующая равновесию Нэша игры, представляет собой лучший ответ на действия других игроков — при условии, что они находятся в (том же) равновесии Нэша — игра стратегии, которая является частью равновесия Нэша, кажется уместной. Это нормативное использование теории игр также подвергалось критике.

Экономика

Теория игр — это основной метод, используемый в математической экономике и бизнесе для моделирования конкурирующего поведения взаимодействующих агентов. Приложения включают широкий спектр экономических явлений и подходов, таких как аукционы, переговоры, слияния и поглощения, ценообразование, справедливое разделение, дуополии, олигополии, формирование социальных сетей, вычислительная экономика на основе агентов, общее равновесие, дизайн механизмов и системы голосования; и во многих широких областях, таких как экспериментальная экономика, поведенческая экономика, информационная экономика, промышленная организация и политическая экономия.

Это исследование обычно сосредоточено на конкретных наборах стратегий, известных как «концепции решения» или «равновесия». Общее предположение состоит в том, что игроки действуют рационально. В некооперативных играх наиболее известным из них является равновесие Нэша. Набор стратегий является равновесием Нэша, если каждая представляет лучший ответ на другие стратегии. Если все игроки играют стратегии в равновесии Нэша, они не имеют одностороннего стимула отклоняться, поскольку их стратегия — это лучшее, что они могут сделать, учитывая, что делают другие.

Выигрыши игры обычно рассматриваются как представляющие полезность отдельных игроков.

Прототипическая статья по теории игр в экономике начинается с представления игры, которая является абстракцией конкретной экономической ситуации. Выбирается одна или несколько концепций решения, и автор демонстрирует, какие наборы стратегий в представленной игре являются равновесиями соответствующего типа. Экономисты и профессора бизнеса предлагают два основных использования (отмечены выше): описательное и предписывающее.

Управленческая экономика

Теория игр также имеет обширное применение в конкретной ветви или направлении экономики — управленческой экономике. Одно важное использование в области управленческой экономики — анализ стратегических взаимодействий между фирмами. Например, фирмы могут конкурировать на рынке с ограниченными ресурсами, и теория игр может помочь менеджерам понять, как их решения влияют на их конкурентов и общие результаты рынка. Теория игр также может использоваться для анализа сотрудничества между фирмами, такого как формирование стратегических альянсов или совместных предприятий. Другое использование теории игр в управленческой экономике — анализ стратегий ценообразования. Например, фирмы могут использовать теорию игр для определения оптимальной стратегии ценообразования на основе того, как они ожидают, что их конкуренты ответят на их решения по ценообразованию. В целом, теория игр служит полезным инструментом для анализа стратегических взаимодействий и принятия решений в контексте управленческой экономики.

Бизнес

Институт закупок и поставок (CIPS) продвигает знания и использование теории игр в контексте деловых закупок. CIPS и TWS Partners провели серию опросов, предназначенных для изучения понимания, осведомлённости и применения теории игр среди специалистов по закупкам. Некоторые из основных выводов их третьего ежегодного опроса (2019) включают:

  • применение теории игр к деятельности по закупкам увеличилось — в то время оно составляло 19% среди всех респондентов опроса
  • 65% участников предсказывают, что использование приложений теории игр будет расти
  • 70% респондентов говорят, что у них есть «только базовое или ниже базового понимание» теории игр
  • 20% участников прошли обучение на рабочем месте по теории игр
  • 50% респондентов сказали, что желательны новые или улучшенные программные решения
  • 90% респондентов сказали, что у них нет необходимого им программного обеспечения для своей работы.

Управление проектами

Разумное принятие решений критично для успеха проектов. В управлении проектами теория игр используется для моделирования процесса принятия решений игроками, такими как инвесторы, менеджеры проектов, подрядчики, субподрядчики, правительства и клиенты. Довольно часто эти игроки имеют конкурирующие интересы, и иногда их интересы прямо вредны для других игроков, что делает сценарии управления проектами хорошо подходящими для моделирования теорией игр.

Пирвиан (Piraveenan) в своём обзоре 2019 года приводит несколько примеров, где теория игр используется для моделирования сценариев управления проектами. Например, инвестор обычно имеет несколько вариантов инвестиций, и каждый вариант, вероятно, приведёт к другому проекту, поэтому один из вариантов инвестиций должен быть выбран до того, как может быть создана хартия проекта. Аналогично, любой крупный проект, включающий субподрядчиков, например строительный проект, имеет сложное взаимодействие между основным подрядчиком (менеджером проекта) и субподрядчиками или между самими субподрядчиками, которое обычно имеет несколько точек принятия решений. Например, если в контракте между подрядчиком и субподрядчиком есть неоднозначность, каждый должен решить, насколько сильно отстаивать свою позицию, не подвергая риску весь проект и, таким образом, свою собственную долю в нём. Аналогично, когда запускаются проекты конкурирующих организаций, маркетинговый персонал должен решить, какое лучшее время и стратегия для маркетинга проекта или его результирующего продукта или услуги, чтобы он мог получить максимальное внимание перед лицом конкуренции. В каждом из этих сценариев требуемые решения зависят от решений других игроков, которые каким-то образом имеют конкурирующие интересы к интересам лица, принимающего решение, и, таким образом, могут быть идеально смоделированы с использованием теории игр.

Пирвиан резюмирует, что игры двух игроков преимущественно используются для моделирования сценариев управления проектами, и на основе личности этих игроков используются пять различных типов игр в управлении проектами:

  • Игры государственного и частного сектора (игры, моделирующие государственно-частные партнёрства)
  • Игры подрядчик-подрядчик
  • Игры подрядчик-субподрядчик
  • Игры субподрядчик-субподрядчик
  • Игры, включающие других игроков

С точки зрения типов игр, как кооперативные, так и некооперативные, как нормальная форма, так и развёрнутая форма, и как нулевая сумма, так и ненулевая сумма используются для моделирования различных сценариев управления проектами.

Политология

Применение теории игр к политической науке сосредоточено на перекрывающихся областях справедливого разделения, политической экономии, общественного выбора, торга о войне, позитивной политической теории и теории социального выбора. В каждой из этих областей исследователи разработали теоретико-игровые модели, в которых игроками часто являются избиратели, государства, группы специальных интересов и политики.

Ранние примеры применения теории игр к политической науке предоставлены Энтони Даунсом (Anthony Downs). В его книге 1957 года «Экономическая теория демократии» он применяет модель размещения фирм Хотеллинга (Hotelling) к политическому процессу. В модели Даунса политические кандидаты берут на себя идеологии в одномерном пространстве политики. Даунс сначала показывает, как политические кандидаты будут сходиться к идеологии, предпочитаемой медианным избирателем, если избиратели полностью информированы, но затем утверждает, что избиратели выбирают оставаться рационально невежественными, что позволяет кандидатам расходиться. Теория игр была применена в 1962 году к Карибскому кризису во время президентства Джона Кеннеди (John F. Kennedy).

Также было предложено, что теория игр объясняет стабильность любой формы политического правительства. Взяв простейший случай монархии, например, король, будучи только одним человеком, не может и не может поддерживать свою власть, лично осуществляя физический контроль над всеми или даже значительным числом своих подданных. Суверенный контроль вместо этого объясняется признанием каждым гражданином того, что все остальные граждане ожидают друг от друга рассматривать короля (или другое установленное правительство) как человека, чьи приказы будут выполняться. Координирование общения между гражданами для замены суверена фактически запрещено, поскольку заговор с целью замены суверена обычно наказывается как преступление. Таким образом, в процессе, который может быть смоделирован вариантами дилеммы заключённого, в периоды стабильности ни один гражданин не найдёт рациональным двигаться, чтобы заменить суверена, даже если все граждане знают, что они были бы лучше, если бы все действовали коллективно.

Теоретико-игровое объяснение демократического мира состоит в том, что открытые и публичные дебаты в демократиях отправляют ясную и надёжную информацию о своих намерениях другим государствам. В контрасте, сложно узнать намерения недемократических лидеров, какой эффект будут иметь уступки и будут ли соблюдаться обещания. Таким образом, будет недоверие и нежелание делать уступки, если по крайней мере одна из сторон в споре — недемократия.

Однако теория игр предсказывает, что две страны могут всё ещё пойти на войну, даже если их лидеры осведомлены о затратах на боевые действия. Война может возникнуть из-за асимметричной информации; две страны могут иметь стимулы неправильно представлять количество военных ресурсов, которые они имеют в наличии, что делает их неспособными урегулировать споры согласованно без применения боевых действий. Кроме того, война может возникнуть из-за проблем с обязательствами: если две страны желают урегулировать спор мирным путём, но каждая желает отступить от условий этого урегулирования, они могут не иметь выбора, кроме как прибегнуть к войне. Наконец, война может возникнуть из-за неделимости проблем.

Теория игр также может помочь предсказать ответы нации, когда применяется новое правило или закон к этой нации. Одним примером является исследование Питера Джона Вуда (Peter John Wood) 2013 года, изучающее, что нации могли бы сделать, чтобы помочь снизить изменение климата. Вуд думал, что это можно было бы достичь, заключив договоры с другими нациями о сокращении выбросов парниковых газов. Однако он пришёл к выводу, что эта идея не может сработать, потому что она создаст дилемму заключённого для наций.

Оборонная наука и технология

Теория игр широко использовалась для моделирования сценариев принятия решений, релевантных для оборонных приложений. Большинство исследований, применивших теорию игр в оборонных условиях, занимаются командованием и управлением боевыми действиями и могут быть дополнительно классифицированы на исследования, рассматривающие (i) боевые действия по распределению ресурсов (ii) информационные боевые действия (iii) боевые действия по управлению оружием и (iv) боевые действия по мониторингу противника. Многие из изучаемых проблем связаны с зондированием и отслеживанием, например боевой корабль, пытающийся отследить враждебную подводную лодку, и подводная лодка, пытающаяся избежать отслеживания, а также взаимозависимое принятие решений, которое происходит в отношении пеленга, скорости и активированной технологии датчиков обоими судами.

Инструмент, например, автоматизирует преобразование общедоступных данных об уязвимостях в модели, позволяя защитникам синтезировать оптимальные стратегии защиты посредством анализа равновесия Штакельберга (Stackelberg equilibrium). Этот подход повышает киберустойчивость, позволяя защитникам предвидеть и противодействовать лучшим ответам злоумышленников, делая теорию игр всё более актуальной в враждебных средах кибербезопасности.

Хо и др. предоставляют широкий обзор применения теории игр в обороне, выделяя её преимущества и ограничения как в физических, так и в кибернетических областях.

Биология

В отличие от экономики, выигрыши для игр в биологии часто интерпретируются как соответствующие приспособленности. Кроме того, внимание было сосредоточено менее на равновесиях, соответствующих понятию рациональности, и больше на тех, которые поддерживались бы эволюционными силами. Наиболее известное равновесие в биологии известно как эволюционно стабильная стратегия, впервые введённая в 1973 году. Хотя её первоначальная мотивация не включала никаких умственных требований равновесия Нэша, каждая эволюционно стабильная стратегия является равновесием Нэша.

В биологии теория игр использовалась как модель для понимания многих различных явлений. Она была впервые использована для объяснения эволюции (и стабильности) приблизительного соотношения полов 1:1. Рональд Фишер предположил, что соотношения полов 1:1 являются результатом эволюционных сил, действующих на людей, которые могли бы рассматриваться как пытающиеся максимизировать количество своих внуков.

Кроме того, биологи использовали эволюционную теорию игр и эволюционно стабильную стратегию для объяснения появления животной коммуникации. Анализ сигнальных игр и других коммуникационных игр дал представление об эволюции коммуникации между животными. Например, поведение мобинга многих видов, при котором большое количество животных-жертв атакуют более крупного хищника, кажется примером спонтанной возникающей организации. Муравьи также были показаны как проявляющие поведение прямой связи, похожее на моду.

Биологи использовали игру в курицу для анализа боевого поведения и территориальности.

По словам Мейнарда Смита в предисловии к «Эволюции и теории игр», «парадоксально, что оказалось, что теория игр более легко применима к биологии, чем к области экономического поведения, для которого она была первоначально разработана». Эволюционная теория игр использовалась для объяснения многих кажущихся несоответствующими явлений в природе.

Одно из таких явлений известно как биологический альтруизм. Это ситуация, в которой организм, кажется, действует способом, который приносит пользу другим организмам и вредит себе. Это отличается от традиционных представлений об альтруизме, потому что такие действия не являются сознательными, но кажутся эволюционными адаптациями для повышения общей приспособленности. Примеры можно найти у видов, начиная от летучих мышей-вампиров, которые отрыгивают кровь, полученную во время ночной охоты, и отдают её членам группы, которые не смогли поесть, до рабочих пчёл, которые ухаживают за королевой пчелой всю жизнь и никогда не спариваются, до верветок, которые предупреждают членов группы о приближении хищника, даже когда это подвергает опасности шанс выживания этого человека. Все эти действия увеличивают общую приспособленность группы, но происходят за счёт отдельного человека.

Эволюционная теория игр объясняет этот альтруизм идеей родственного отбора. Альтруисты различают людей, которым они помогают, и отдают предпочтение родственникам. Правило Гамильтона (Hamilton’s rule)

🔑 Ключевые факты

  • Теория игр началась с работ Джона фон Неймана в 1928 году о стратегических равновесиях
  • Джон Нэш разработал концепцию равновесия Нэша в 1950 году, применимую к широкому спектру игр
  • 15 теоретиков игр получили Нобелевскую премию по экономике с 1994 года
  • Игры делятся на кооперативные и некооперативные, симметричные и асимметричные, с нулевой и ненулевой суммой
  • Теория игр применяется в экономике, биологии, политике, философии и искусственном интеллекте
  • Развёрнутая форма используется для последовательных игр, нормальная форма — для одновременных
  • Эволюционная теория игр изучает адаптацию стратегий во времени без предположения рациональности

❓ Часто задаваемые вопросы

Что такое равновесие Нэша?
Равновесие Нэша — это набор стратегий, при котором ни один игрок не может улучшить свой результат, в одностороннем порядке изменив свою стратегию. Это концепция, разработанная Джоном Нэшем в 1950 году, которая стала центральной в теории игр.
В чём разница между кооперативными и некооперативными играми?
В кооперативных играх игроки могут заключать обязывающие соглашения, обеспеченные внешней силой. В некооперативных играх такие соглашения невозможны или должны быть самоисполняющимися. Некооперативная теория анализирует равновесия Нэша отдельных игроков.
Какие типы игр существуют в теории игр?
Основные типы включают: игры с нулевой и ненулевой суммой, симметричные и асимметричные, одновременные и последовательные, с совершенной и несовершенной информацией, кооперативные и некооперативные, а также комбинаторные, дифференциальные и стохастические игры.
Как теория игр применяется в реальной жизни?
Теория игр используется для анализа экономического поведения фирм и потребителей, политических стратегий, биологической эволюции, дизайна аукционов, переговоров и многих других ситуаций стратегического взаимодействия.
Что такое дилемма заключённого?
Дилемма заключённого — это классическая игра с ненулевой суммой, демонстрирующая, почему рациональные игроки могут не сотрудничать, даже если это было бы взаимно выгодно. Она показывает конфликт между индивидуальной и коллективной рациональностью.

💡 Интересные факты

  • Джон фон Нейман использовал теорему о неподвижной точке Брауэра для доказательства существования смешанных стратегических равновесий, что стало стандартным методом в теории игр
  • Первые обсуждения математики игр начались ещё в XVI веке с работы Кардано об азартных играх, опубликованной посмертно в 1663 году
  • Эрнст Цермело в 1913 году доказал, что в шахматах существует оптимальная стратегия, строго определённая теорией множеств, хотя она остаётся неизвестной

🔗 Связанные темы

Равновесие Нэша и его применениеДилемма заключённого и кооперацияЭволюционная теория игрТеория механизмов и дизайн аукционовИгры с несовершенной информациейПрименение теории игр в экономикеИскусственный интеллект и теория игр
📄 Материал основан на статье из английской Wikipedia. Лицензия: CC BY-SA 4.0. Текст переведён и адаптирован для Gamblipedia.
18+

Gamblipedia — энциклопедия азартных игр. Сайт носит исключительно информационный и образовательный характер.

Мы не рекламируем и не пропагандируем азартные игры и казино.