Мнение: бот, обыгравший «лучших игроков мира в 6-макс Холдем» — реклама для дорогой продажи

Sorry, this entry is only available in Russian.

На этой неделе все покерные сайты разорвала новость о том, что бот Плурибус сыграл в +5 бб/100 против профессиональных игроков в НЛ Холдем 6-макс.

Но пока чёрт выглядит не так страшно, как его малюют. Есть мнение, что все громкие заголовки про «решенный покер» — реклама для более дорогой продажи Пентагону и другим военным структурам.

Плурибус играет против профессионалов

«Искусственный разум обыграл всех лучших игроков в покер», «Покерный бот Pluribus решил 6-макс NLHE, «Плурибус побеждает профессионалов, включая Линуса Лёлигера» — на громкие заголовки СМИ нынче не скупились.

Если вы до сих пор не в курсе, о чем идет речь, то вот краткая справка. На этой неделе ученые университета Карнеги – Меллона представили программу Плурибус. По словам создателей, бот обыграл в безлимитный Холдем 6-макс «лучших покерных профессионалов». Среди обыгранных про называли даже имена Линуса «LLinusLLove» Лёлигера — сильнейшего из людей в НЛ Холдем и Ника Петранджело — одного из топовых МТТшников.

В разработке принял участие 4-кратный чемпион WPT Даррен Элиаш. Он сказал, что изначально играл каждый день против пяти ботов по несколько тысяч раздач — и уже через несколько дней программа прошла путь от посредственности до игрока мирового уровня. После этого было решено провести два эксперимента: сначала человек играет против пяти ботов, а затем пять человек против одного Плурибуса.

В первом варианте против пяти ботов играли вышеупомянутый Элиаш, победитель Главного турнира Мировой серии Крис Фергюсон и Линус Лёлигер. Во втором формате против бота сыграло играло 13 человек: Грег Мерсон, Сет Дэвис, Майкл Гальяно, Тони Грегг, Джейсон Лес, Донг Ким, Шон Руане, Тревор Сэведж, Джейкоб Тул, Даниэль МакОлэй и Джимми Чоу. Всё они – регуляры средней руки, а некоторые и вовсе на хайстейкс будут считаться фишами.

Линус «LLinusLLove» Лёлигер

По итогам первого эксперимента были зафиксированы следующие результаты: Даррен Элиаш показал лузрейт 4,02 бб/100 (то есть за каждые 100 раздач он проигрывал 4 ББ), Крис Фергюсон — лузрейт 2,52 бб/100.

Линус Лёлигер сыграл в -0,5± 1 бб/100 — в ноль, грубо говоря. И это против лучшего бота в истории человечества! Если объединить все эти три результата, получается, что люди совместными усилиями-таки дали бой роботу.

Во втором эксперименте Плурибусу противостояли безвестные вышеназванные игроки, против которых он показал винрейт 4.77 бб/100 — если бы игра шла на реальные деньги, то Плурибус выигрывал бы по тысяче долларов в час.

Самообучение машины было настолько впечатляющим, что бот прошел путь от нуля до игрока среднего уровня за 7 часов игры, а спустя 20 часов превзошел элитный уровень игры.

Ученые показали несколько раздач, сыгранных ботом против пяти людей:

Также разработчики отметили, что не будут публиковать алгоритм в общем доступе, чтобы не навредить покерной экологии. И всё это в целом выглядит достаточно страшно. Но есть и другое мнение.

На форуме GipsyTeam один из игроков хай-стейк кэша выразил мнение, что все громкие статьи — не более чем рекламная кампания, чтобы подороже продать разработку военным. Игрок под ником DrRuBack назвал всех игроков, участвовавших в играх против Плурибуса, «середнячками и бомжами»:

«Супер результат в 3-4 бб/100 (даже рейк не побьют), против списка середнячков и бомжей, у которых 6-макс не профильная дисциплина. Из топов только Петранжело и Линус», — регуляр высоких лимитов кэш-игры

И если задуматься, в словах форумчанина есть доля правды. Например, Крис Фергюсон, который играл в первом эксперименте против 5 ботов (и проиграл 2,5 бб/100), уже давно не является специалистом по НЛ Холдему — зато у него есть громкое звание Чемпиона мира по покеру 2000 года.
Крис Фергюсон

«Судя по Фергюсону, цель была эффектно победить профессионалов, в рекламных целях, а не в самом деле проверить силу бота»

Игрок привел в пример одну из таблиц, которая была опубликована в научных статьях про успехи Плурибуса. В этой таблице показаны винрейты людей, которые участвовали во втором эксперименте:

Винрейты людей, участвовавших во втором эксперименте

«Первый игрок отыграл в +14бб/100 (уже после variance reduction) за 9к раздач, с отклонением 8.5бб/100 (если я правильно перевел 1 mbb/hand = 0.001 bb/hand = 0.1 bb/100). То есть отыграл в приличный плюс с их доверительным интервалом.

Но нет, в обзорных статьях нам расскажут про супер чемпиона Даррена Элиаса с -4бб/100 и расскажут про средний винрейт»

Под критику попали и некоторые раздачи, сыгранные роботом против людей (видео можно найти выше в этой статье):

«Ну и раздачи показательные впихнули. Чек ривера с QJ на Q97-4-2 после чек колла флопа и чек чека терна, с целью сделать чек рейз на пол стэка с подписью «Most humans would give up on the trap and choose to bet, but Pluribus continues the trap» (Большинство людей откажется от ловушки в пользу ставки, но Плурибус выбирает ловушку).

Ага, Плурибус чекает ривер с частотой 1% (судя по солверу), а они это выдают как дефолтную линию, мол смотрите, как много он добрал, не то что кожаные мешки с костями. Посмотрел бы я на эту раздачу, где у оппа была бы не идеальная рука для такой линии QT, а например 22. И подпись “Плурибус залил стэк в споте, где человек смог бы отскочить”.

Могу ошибаться, но больше похоже на “муть, чушь и компот, сделанные с определенными целями”.

В любом случае, самый точный итог эксперимента подвел журналист GipsyTeam Михаил Савинов, который одним из первых опубликовал обзорную статью об эксперименте на русском языке:

«В целом ни для любителей, ни для профессионалов ничего особенного, наверное, не произошло. И до Плурибуса большинство играющих в покер остались бы в минусе против сильного бота. Теперь в зоне риска оказались и небожители самых высоких лимитов.

Однако игра бота всё равно резко отличается от игры человека, и задача выявления искусственного интеллекта по базам раздач относительно тривиальна, нужны лишь желание рума и компетентная служба безопасности», пишет GipsyTeam.