Gamblipedia — Энциклопедия азартных игр

Pluribus: покерный бот ИИ

Покерный бот Pluribus — это революционная разработка в области искусственного интеллекта, созданная лабораторией AI Lab компании Meta совместно с Университетом Карнеги-Меллона. Этот бот стал первым в истории, кто победил профессиональных игроков в сложном многопользовательском варианте No-Limit Texas Hold’em, используя самообучение и адаптацию в реальном времени.

📋 Краткое описание
Pluribus — покерный бот на основе ИИ, разработанный Meta и Университетом Карнеги-Меллона, первый в истории победивший профессиональных игроков в многопользовательском No-Limit Texas Hold’em. Бот использует самообучение и адаптацию в реальном времени, выигрывая в среднем $5 за раздачу.

Компьютерный покерист

Pluribus — компьютерный покерист, использующий искусственный интеллект, разработанный лабораторией AI Lab Facebook (Meta) и Университетом Карнеги — Меллона. Pluribus играет в вариант покера no-limit Texas hold’em и является «первым ботом, победившим людей в сложном многопользовательском соревновании». Разработчики бота опубликовали свои результаты в 2019 году.

По словам создателей Pluribus, «разработка сверхчеловеческого ИИ для многопользовательского покера была широко признанным главным оставшимся достижением» в компьютерном покере до появления Pluribus. Pluribus полагается на автономное самообучение для построения базовой стратегии, но затем продолжает учиться в реальном времени во время онлайн-игры. Базовая стратегия была вычислена за восемь дней и по рыночным ценам обошлась бы примерно в $144, что намного меньше, чем современные достижения в области сверхчеловеческих игровых ИИ, такие как AlphaZero. В области ИИ двухпользовательские игры с нулевой суммой (такие как heads-up hold’em) обычно выигрываются путём аппроксимации стратегии равновесия Нэша; однако этот подход не работает для игр с тремя или более игроками. Pluribus вместо этого использует подход, который не имеет сильных теоретических гарантий, но тем не менее хорошо работает на практике при победе над человеческими игроками. На протяжении соревнований Pluribus выигрывал в среднем более 30 миллибигблайндов за игру. Самостоятельно выработанный стиль игры Pluribus избегает «лимпа» (уравнивания большого блайнда) и чаще, чем эксперты-люди, использует «донк-бет» (завершение раунда коллом и начало следующего раунда ставкой).

Среди профессиональных покеристов Джейсон Лес (Jason Les) заявил, что чувствовал себя «совершенно безнадёжно. Не кажется, что есть что-то, что ты можешь сделать, чтобы выиграть». Крис Фергюсон (Chris Ferguson) сказал: «Pluribus — очень сложный противник. Действительно сложно понять, какие карты у него на руках». Джимми Чоу (Jimmy Chou) заметил: «Когда я играю против бота, я постоянно узнаю что-то новое, что могу применить в своей игре». В The Wall Street Journal редактор отдела науки Даниэла Эрнандес (Daniela Hernandez) охарактеризовала Pluribus как «продвинутого в ключевом человеческом навыке — обмане».

Играя в No-Limit Hold’em против пяти профессиональных покеристов, Pluribus выигрывал в среднем $5 за раздачу с выигрышем $1000 в час, что Facebook описал как «решающее преимущество в победе».

После победы разработчики отказались выпускать исходный код, опасаясь, что его могут использовать для скрытого мошенничества против человеческих игроков в онлайн-матчах.

🔑 Ключевые факты

  • Pluribus разработан лабораторией AI Lab Facebook (Meta) и Университетом Карнеги-Меллона
  • Первый бот, победивший людей в сложном многопользовательском покерном соревновании
  • Базовая стратегия вычислялась 8 дней и стоила примерно $144
  • Выигрывал в среднем более 30 миллибигблайндов за игру против профессионалов
  • Результаты опубликованы в 2019 году
  • Использует автономное самообучение и обучение в реальном времени
  • Исходный код не был выпущен из-за опасений мошенничества

Как работает покерный бот Pluribus

❓ Часто задаваемые вопросы

Что такое Pluribus и кто его создал?
Pluribus — это покерный бот на основе искусственного интеллекта, разработанный лабораторией AI Lab Facebook (Meta) в сотрудничестве с Университетом Карнеги-Меллона. Это первый бот, который смог победить профессиональных покеристов в многопользовательском No-Limit Texas Hold’em.
Как Pluribus обучается играть в покер?
Pluribus использует двухэтапный подход: сначала вычисляет базовую стратегию через автономное самообучение (заняло 8 дней), а затем продолжает учиться в реальном времени во время онлайн-игры, адаптируясь к противникам.
Какие результаты показал Pluribus против профессионалов?
Играя против пяти профессиональных покеристов в No-Limit Hold’em, Pluribus выигрывал в среднем $5 за раздачу, что составляет примерно $1000 в час. Он также выигрывал более 30 миллибигблайндов за игру.
Почему исходный код Pluribus не был опубликован?
Разработчики отказались выпускать исходный код из-за опасений, что его могут использовать для скрытого мошенничества против человеческих игроков в онлайн-матчах покера.
Чем Pluribus отличается от других покерных ботов?
Pluribus — первый бот, который победил людей в многопользовательском покере, а не только в двухпользовательских играх. Он использует инновационный подход, не полагаясь на стратегию равновесия Нэша, и демонстрирует сложный стиль игры с редким лимпом и частыми донк-бетами.

💡 Интересные факты

  • Pluribus самостоятельно разработал стиль игры, который избегает ‘лимпа’ (уравнивания большого блайнда) и чаще использует ‘донк-бет’ — тактику, которую профессиональные игроки считают необычной
  • Базовая стратегия Pluribus была вычислена всего за 8 дней и обошлась примерно в $144 — намного дешевле, чем разработка других сверхчеловеческих игровых ИИ типа AlphaZero
  • Профессиональный покерист Джимми Чоу признал, что играя против Pluribus, он постоянно узнавал новые стратегические приёмы, которые мог применить в своей игре

🔗 Связанные темы

Искусственный интеллект в играхNo-Limit Texas Hold’em правилаСтратегия покераКомпьютерные игроки и ботыРавновесие Нэша в покереИстория развития покерных ботовПрофессиональный покер
📄 Материал основан на статье из английской Wikipedia. Лицензия: CC BY-SA 4.0. Текст переведён и адаптирован для Gamblipedia.
18+

Gamblipedia — энциклопедия азартных игр. Сайт носит исключительно информационный и образовательный характер.

Мы не рекламируем и не пропагандируем азартные игры и казино.