Покер-бот Polaris — это инновационная программа, разработанная Университетом Альберты для игры в техасский холдем. Проект велся более 16 лет и продемонстрировал способность конкурировать с профессиональными игроками, выигрывая турниры и показывая высокий уровень стратегического мышления.
Polaris — покер-бот Университета Альберты для игры в техасский холдем. Программа разработана за 16 лет и успешно конкурировала с профессиональными игроками, выигрывая турниры и демонстрируя высокий уровень стратегического мышления.
Программа для игры в техасский холдем
Polaris — это программа для игры в техасский холдем, разработанная группой компьютерных исследований покера Университета Альберты (University of Alberta). Проект велся в течение 16 лет по состоянию на 2007 год. Polaris представляет собой комплексную программу, состоящую из нескольких ботов, включая Hyperborean08, победителя серии лимитированного равновесия на Компьютерном покер-турнире Ассоциации развития искусственного интеллекта (AAAI) в 2008 году. Polaris также содержит ряд других фиксированных стратегий и выбирает между ними во время матча. Программе требуется минимальная вычислительная мощность во время матча, поэтому она запускается на ноутбуке Apple MacBook Pro во время соревнований. Polaris играет только в хедс-ап (один на один) лимитированный техасский холдем.
Игра против профессионалов
23–24 июля 2007 года Polaris сыграла против профессиональных покеристов Фила Лаака (Phil Laak) и Али Эслами (Ali Eslami) в отеле Hyatt Regency в Ванкувере, Британская Колумбия. Соревнование состояло из четырех дублированных матчей по 500 рук в каждом. В каждом дублированном матче одни и те же карты раздавались обеим парам игроков — людям и боту, но с развернутыми позициями. Это означало, что если Polaris получала плохие карты в одной половине матча против Лаака, другая копия Polaris получала хорошие карты в другой половине матча против Эслами. Это было сделано для снижения дисперсии, или «фактора удачи», так как ни одна команда не могла сказать, что получила худший набор карт. Два игрока находились в отдельных комнатах, чтобы исключить возможность того, что публика раскроет информацию о картах, что было бы особенно проблематично в дублированном матче. Лаак ранее играл против предшественника Polaris — Vexbot в 2005 году на предыдущем турнире. Лаак признал, что удача сыграла роль в его победе над Vexbot.
После примерно 64 часов игры Polaris сыграла вничью в первом раунде, выиграла второй и проиграла последние два. Один из проигранных матчей был против обучающегося варианта, который пытался переключаться между несколькими стилями игры, а все остальные — против больших статических рандомизированных наборов правил, которые аппроксимируют пару стратегий равновесия Нэша. Лаак и Эслами разделили 1 доллар за две победы и 2500 долларов за ничью.
3–6 июля 2008 года Polaris участвовала во Втором чемпионате человека и машины по покеру, проходившем в Лас-Вегасе на выставке 2008 Gaming Life Expo. Polaris победила человеческих игроков с тремя победами, двумя поражениями и одной ничьей. Каждая из шести сессий была дублированным матчем из 500 рук против двух разных игроков, в результате чего было сыграно шесть тысяч рук. Во всех шести сессиях Polaris выиграла 195 больших блайндов. Версия Polaris, использованная в матче 2008 года, была намного сильнее версии 2007 года как по качеству компонентных стратегий, так и по способности выбирать, какую компонентную стратегию использовать.
🔑 Ключевые факты
- Polaris разработана Университетом Альберты за 16 лет исследований
- Включает несколько ботов, в том числе Hyperborean08 — победителя AAAI в 2008 году
- Играет только в хедс-ап лимитированный техасский холдем
- В 2007 году сыграла вничью с профессионалами Филом Лааком и Али Эслами
- В 2008 году победила человеческих игроков с результатом 3 победы, 2 поражения, 1 ничья
- Требует минимальной вычислительной мощности и запускается на MacBook Pro
- Выбирает между несколькими фиксированными стратегиями во время матча
Что такое покер-бот Polaris
❓ Часто задаваемые вопросы
💡 Интересные факты
- Polaris была протестирована в дублированных матчах, где одни и те же карты раздавались обеим парам игроков с развёрнутыми позициями, чтобы исключить влияние удачи на результат
- Фил Лаак ранее играл против предшественника Polaris под названием Vexbot в 2005 году и признал, что удача сыграла роль в его победе
- Версия Polaris 2008 года была значительно сильнее версии 2007 года благодаря улучшению качества компонентных стратегий и алгоритма их выбора