Искусственному интеллекту впервые удалось обыграть 5 чемпионов в покер

Ещё в начале 2017 года компьютерной программе Libratus удалось обыграть четверых профессиональных покеристов и выиграть у них 2 000 000 долларов. Но разработчики данного ПО не остановились на этом, представив новый вариант его под названием Pluribus, на данный момент обыгравший одновременно пятерых чемпионов по техасскому холдему, ведя игру со всей этой группой за единым столом. Эта разработка описана в журнале Science.

Как работает ИИ

По словам Ноя Брауна, сотрудника Университета Карнеги-Меллона (США), среди создателей Pluribus был искусственный интеллект, который вырабатывал собственную стратегию, создав при этом серию новых приёмов, способных в будущем оказать влияние на игры профессиональных покеристов.

Создатели Pluribus наделили программу такими свойствами, как «абстрактное действие» и «абстрактная информация». В результате программа отбросила ненужные варианты будущих ходов, оставив только необходимые для правильных решений. В ходе тестирования Pluribus, применяя самообучение и принцип минимизации сожалений, подразумевающий максимальное сокращение программой разницы между принятым ею решением и лучшей стратегией, играла в покер с пятью собственными копиями, причём вначале игру она вела наугад.

Затем искусственный интеллект обучился анализу ходов, сумев понять, какие именно действия и с какими шансами обеспечат победу.

Основная часть этого эксперимента заняла 12 дней и включала две стадии: один игрок против пяти копий Pluribus и пять профессиональных игроков против программы.

Источник

Интересное по теме