Gamblipedia — Энциклопедия азартных игр

Claudico: AI-программа для покера

Claudico покер — это революционная программа искусственного интеллекта, созданная для игры в безлимитный техасский холдем. Разработанная профессором Туомасом Сандхольмом из Университета Карнеги-Меллон, программа стала известна благодаря историческому матчу 2015 года против четырёх профессиональных игроков, где люди одержали победу.

📋 Краткое описание
Claudico — это AI-программа для игры в безлимитный техасский холдем, разработанная профессором Туомасом Сандхольмом из Университета Карнеги-Меллон. В 2015 году бот участвовал в историческом матче против четырёх профессиональных покеристов, где люди одержали победу с разницей в 732 713 фишек.

Компьютерная программа на основе искусственного интеллекта для игры в покер

Claudico — это компьютерная программа на основе искусственного интеллекта, разработанная для игры в безлимитный техасский холдем в формате один на один.

История

Claudico была разработана профессором Университета Карнеги — Меллон Туомасом Сандхольмом и его аспирантами. Название означает «я делаю лимп» на латыни — отсылка к стратегии входа в раздачу без повышения ставки, которую часто использует бот. Вместо того чтобы просить профессионального покеристов объяснить свою стратегию команде программистов, Сандхольм позволил компьютеру самостоятельно разработать оптимальную тактику. Задача оказалась настолько сложной, что потребовала суперкомпьютер Blacklight из Питтсбургского центра суперкомпьютерных вычислений с 16 терабайтами оперативной памяти.

Объясняя мотивацию создания бота, Сандхольм сказал: «Покер теперь является эталоном для исследований искусственного интеллекта, как когда-то шахматы. Это игра исключительной сложности, требующая от машины принимать решения на основе неполной и часто вводящей в заблуждение информации благодаря блефу, медленной игре и другим уловкам».

Первоначально программа называлась Tartanian. Её версия выиграла турнир в июле 2014 года против других компьютерных программ.

Улучшенным преемником Claudico является Libratus. Как и Claudico, Libratus разработана для соревнований с лучшими игроками-людьми.

Матч против четырёх профессиональных игроков в 2015 году

С 24 апреля по 8 мая 2015 года Claudico участвовала в турнире в казино Rivers Casino в Питтсбурге, Пенсильвания. Бот играла против четырёх ведущих профессионалов — Дона Кима, Джейсона Леса, Бьёрна Ли и Дага Полка — в серии матчей один на один. На тот момент Полк был лучшим в мире игроком в формате один на один.

Каждый день проводилось два матча по 750 раздач в течение восьми часов (плюс перерывы) против каждого из игроков, всего 20 000 раздач на одного противника за 13 дней (с одним выходным днём в середине). Для каждого набора из 750 раздач одного человека играли против Claudico на основном полу казино, а другого — с компьютером в изолированной комнате, при этом карты были перевёрнуты. Это делалось для того, чтобы удача в раздачах не влияла на результат. Выборка из 80 000 раздач представляла собой крупнейший в истории набор данных для противостояния человека и компьютера. Claudico могла адаптироваться к стратегии противника по ходу матча, как и люди. Победитель определялся по общему количеству фишек после 80 000 раздач; хотя индивидуальные результаты четырёх профессионалов учитывались, они играли как единая команда. Если бы финальное количество фишек было слишком близким для статистически значимого различия, матч был бы объявлен ничьей.

Турнир имел призовой фонд в 100 000 долларов, финансируемый казино Rivers Casino и Microsoft. Казино установила трибуны и видеоэкраны для публики, чтобы наблюдать за игрой в прямом эфире. Кроме того, матчи транслировались онлайн через Twitch. Лучшие моменты матча выходили в течение 2015 года в еженедельной программе Poker Night in America на канале CBS Sports Network.

Перед началом турнира Сандхольм оценил шансы Claudico на победу как 50 на 50. Однако Полк был уверен, что люди имеют преимущество. Он признал, что компьютеры, вероятно, со временем превзойдут человеческую игру, но сказал: «Надеюсь, мы сможем заставить их сыграть ещё несколько раундов после этого, как Каспаров». Он сказал, что его стратегия будет «меняться больше, чем при игре против человеческих противников… Я думаю, будет меньше чтения рук, так сказать, и психологических игр».

Блайнды составляли 50 и 100 фишек за каждую раздачу, а стек фишек как человека, так и компьютера сбрасывался до 20 000 в начале каждой раздачи. На середине матча команда людей была впереди на 458 000 фишек против Claudico. Люди продолжили увеличивать своё преимущество и выиграли матч с разницей в 732 713 фишек. Полк закончил с прибылью 213 000, Ли выиграл 529 000, Ким обыграл Claudico на 70 000, а Лес закончил с убытком 80 000. Всего было поставлено 170 миллионов фишек за 80 000 раздач. Полк сказал, что Claudico хорошо сыграла в некоторых ситуациях, но также допустила плохие ходы. В целом она играла совсем не так, как люди. «Там, где человек мог бы поставить половину или три четверти банка, Claudico иногда ставила жалкие 10 процентов или чрезмерные 1000 процентов», объяснил он. «Ставить 19 000 долларов, чтобы выиграть банк в 700 долларов — это просто не то, что делает человек».

🔑 Ключевые факты

  • Claudico разработана профессором Туомасом Сандхольмом и его аспирантами из Университета Карнеги-Меллон
  • Название происходит от латинского слова, означающего ‘я делаю лимп’ — отсылка к стратегии входа без повышения ставки
  • Для разработки использовался суперкомпьютер Blacklight с 16 терабайтами оперативной памяти
  • В апреле-мае 2015 года Claudico сыграла 80 000 раздач против четырёх профессионалов в казино Rivers Casino
  • Матч был профинансирован казино Rivers Casino и Microsoft с призовым фондом 100 000 долларов
  • Люди выиграли матч с разницей в 732 713 фишек, несмотря на предварительную оценку шансов 50 на 50
  • Преемником Claudico стала программа Libratus, также разработанная для соревнований с профессиональными игроками

Claudico покер: характеристики и особенности

❓ Часто задаваемые вопросы

Что такое Claudico и для чего она была создана?
Claudico — это компьютерная программа на основе искусственного интеллекта, разработанная профессором Туомасом Сандхольмом для игры в безлимитный техасский холдем один на один. Её создание было направлено на исследование возможностей AI в принятии решений на основе неполной информации, что является одной из самых сложных задач в области искусственного интеллекта.
Почему программу назвали Claudico?
Название происходит от латинского слова, означающего ‘я делаю лимп’ — это отсылка к стратегии входа в раздачу без повышения ставки, которую часто использует бот. Разработчики выбрали это название как символ особенности игровой тактики программы.
Кто победил в матче Claudico против профессионалов в 2015 году?
Команда из четырёх профессиональных покеристов (Дона Кима, Джейсона Леса, Бьёрна Ли и Дага Полка) одержала победу над Claudico с разницей в 732 713 фишек после 80 000 раздач. Люди смогли адаптироваться к игре бота и использовать его ошибки в определении размера ставок.
Какие ошибки допускала Claudico во время матча?
По словам Дага Полка, Claudico часто делала неправильные размеры ставок — иногда ставила слишком мало (10% от банка вместо половины), а иногда чрезмерно много (1000% от банка). Например, программа ставила 19 000 долларов, чтобы выиграть банк в 700 долларов, что не соответствует человеческой логике игры.
Какой суперкомпьютер использовался для разработки Claudico?
Для разработки Claudico использовался суперкомпьютер Blacklight из Питтсбургского центра суперкомпьютерных вычислений с 16 терабайтами оперативной памяти. Задача разработки оптимальной стратегии для безлимитного холдема оказалась настолько сложной, что потребовала такие мощные вычислительные ресурсы.

💡 Интересные факты

  • Первоначально программа называлась Tartanian и выиграла турнир против других компьютерных программ в июле 2014 года, прежде чем получить новое имя Claudico
  • Матч в 2015 году был крупнейшим в истории набором данных для противостояния человека и компьютера — всего 80 000 раздач с использованием специальной системы перевёрнутых карт для исключения влияния удачи
  • Профессор Сандхольм намеренно не просил опытных покеристов объяснять свою стратегию, а позволил компьютеру самостоятельно разработать оптимальную тактику через машинное обучение

🔗 Связанные темы

Libratus — преемник ClaudicoТехасский холдем: правила и стратегияИскусственный интеллект в азартных играхИстория противостояния человека и компьютера в играхПокер один на один: тактика и стратегияБлеф в покере: психология и техникаУниверситет Карнеги-Меллон: исследования в области AI
📄 Материал основан на статье из английской Wikipedia. Лицензия: CC BY-SA 4.0. Текст переведён и адаптирован для Gamblipedia.
18+

Gamblipedia — энциклопедия азартных игр. Сайт носит исключительно информационный и образовательный характер.

Мы не рекламируем и не пропагандируем азартные игры и казино.