Покерный бот Pluribus — это революционная разработка в области искусственного интеллекта, созданная лабораторией AI Lab компании Meta совместно с Университетом Карнеги-Меллона. Этот бот стал первым в истории, кто победил профессиональных игроков в сложном многопользовательском варианте No-Limit Texas Hold’em, используя самообучение и адаптацию в реальном времени.
Pluribus — покерный бот на основе ИИ, разработанный Meta и Университетом Карнеги-Меллона, первый в истории победивший профессиональных игроков в многопользовательском No-Limit Texas Hold’em. Бот использует самообучение и адаптацию в реальном времени, выигрывая в среднем $5 за раздачу.
Компьютерный покерист
Pluribus — компьютерный покерист, использующий искусственный интеллект, разработанный лабораторией AI Lab Facebook (Meta) и Университетом Карнеги — Меллона. Pluribus играет в вариант покера no-limit Texas hold’em и является «первым ботом, победившим людей в сложном многопользовательском соревновании». Разработчики бота опубликовали свои результаты в 2019 году.
По словам создателей Pluribus, «разработка сверхчеловеческого ИИ для многопользовательского покера была широко признанным главным оставшимся достижением» в компьютерном покере до появления Pluribus. Pluribus полагается на автономное самообучение для построения базовой стратегии, но затем продолжает учиться в реальном времени во время онлайн-игры. Базовая стратегия была вычислена за восемь дней и по рыночным ценам обошлась бы примерно в $144, что намного меньше, чем современные достижения в области сверхчеловеческих игровых ИИ, такие как AlphaZero. В области ИИ двухпользовательские игры с нулевой суммой (такие как heads-up hold’em) обычно выигрываются путём аппроксимации стратегии равновесия Нэша; однако этот подход не работает для игр с тремя или более игроками. Pluribus вместо этого использует подход, который не имеет сильных теоретических гарантий, но тем не менее хорошо работает на практике при победе над человеческими игроками. На протяжении соревнований Pluribus выигрывал в среднем более 30 миллибигблайндов за игру. Самостоятельно выработанный стиль игры Pluribus избегает «лимпа» (уравнивания большого блайнда) и чаще, чем эксперты-люди, использует «донк-бет» (завершение раунда коллом и начало следующего раунда ставкой).
Среди профессиональных покеристов Джейсон Лес (Jason Les) заявил, что чувствовал себя «совершенно безнадёжно. Не кажется, что есть что-то, что ты можешь сделать, чтобы выиграть». Крис Фергюсон (Chris Ferguson) сказал: «Pluribus — очень сложный противник. Действительно сложно понять, какие карты у него на руках». Джимми Чоу (Jimmy Chou) заметил: «Когда я играю против бота, я постоянно узнаю что-то новое, что могу применить в своей игре». В The Wall Street Journal редактор отдела науки Даниэла Эрнандес (Daniela Hernandez) охарактеризовала Pluribus как «продвинутого в ключевом человеческом навыке — обмане».
Играя в No-Limit Hold’em против пяти профессиональных покеристов, Pluribus выигрывал в среднем $5 за раздачу с выигрышем $1000 в час, что Facebook описал как «решающее преимущество в победе».
После победы разработчики отказались выпускать исходный код, опасаясь, что его могут использовать для скрытого мошенничества против человеческих игроков в онлайн-матчах.
🔑 Ключевые факты
- Pluribus разработан лабораторией AI Lab Facebook (Meta) и Университетом Карнеги-Меллона
- Первый бот, победивший людей в сложном многопользовательском покерном соревновании
- Базовая стратегия вычислялась 8 дней и стоила примерно $144
- Выигрывал в среднем более 30 миллибигблайндов за игру против профессионалов
- Результаты опубликованы в 2019 году
- Использует автономное самообучение и обучение в реальном времени
- Исходный код не был выпущен из-за опасений мошенничества
Как работает покерный бот Pluribus
❓ Часто задаваемые вопросы
💡 Интересные факты
- Pluribus самостоятельно разработал стиль игры, который избегает ‘лимпа’ (уравнивания большого блайнда) и чаще использует ‘донк-бет’ — тактику, которую профессиональные игроки считают необычной
- Базовая стратегия Pluribus была вычислена всего за 8 дней и обошлась примерно в $144 — намного дешевле, чем разработка других сверхчеловеческих игровых ИИ типа AlphaZero
- Профессиональный покерист Джимми Чоу признал, что играя против Pluribus, он постоянно узнавал новые стратегические приёмы, которые мог применить в своей игре