Штучний інтелект переміг професійних гравців в покер

Futurama: Into the Wild Green Yonder / 20th Century Fox 2009

Програма Libratus, розроблена в Університеті Карнегі - Меллона, перемогла в 20-денному покерному турнірі «Brains Vs. Artificial Intelligence: Upping the Ante ». Комп'ютер виграв фішок на суму понад 1,7 мільйона доларів, повідомляє New Scientist.

Останнім часом напрацювання в області машинного навчання дозволили комп'ютерів значно просунутися вперед і обіграти людей в іграх, в яких це традиційно вважалося неможливим. Однак, аж до недавнього часу люди як і раніше перемагали в іграх з неповною інформацією. У 2015 році програма Claudico (попередник Libratus) грала з чотирма професійними гравцями і зайняла передостаннє місце. Протягом двох тижнів було зіграно 80000 роздач, і з чотирьох живих гравців тільки один набрав менше фішок, ніж комп'ютер.

У турнірі, який проходив в Пітсбурзькому казино Rivers було зіграно 120 тисяч роздач в безлімітний техаський холдем один на один (Хедз-Ап), проти Libratus грали Даніель Маколей, Джиммі Чу, Донг Кім і Джейсон Ліс. В результаті 20-денного турніру програма перемогла людей, заробивши більше 1,7 мільйона доларів в фішках. Незважаючи на це, розробники не отримають ніяких грошей, а призовий фонд в 200 тисяч доларів буде поділений між чотирма живими гравцями в залежності від зайнятого місця.

На даний момент точно не відомо, як саме працює Libratus, автори описали лише загальну структуру програми та планують у найближчому майбутньому опублікувати статтю в журналі, що рецензується. За словами розробників, Libratus складається з трьох частин. Основне «ядро» Libratus було підготовлено заздалегідь, обчислення зайняли 15 мільйонів ядро-годин, в той час як на Claudico пішло два-три мільйони. Друга частина програми стежила за можливими помилками, які могли допустити суперники, і враховувала в процесі гри цю інформацію. Третя частина Libratus відстежувала власні слабкі сторони, які могли використовувати противники, і змінювала загальну стратегію з урахуванням цих даних. Такий підхід дозволив програмі як блефувати самостійно, так і розпізнавати дезінформацію з боку суперників.

На думку авторів програми у систем, подібних Libratus, велике майбутнє в самих різних сферах, де доводиться мати справу з неповною інформацією. В якості можливих сфер застосування програми дослідники називають інформаційну безпеку, військова справа, аукціони, переговори і навіть бережливе розподіл медикаментів.

Крім покеру машини також перемогли людей в го, гру з повною інформацією. У минулому році програма AlphaGo виграла у одного з найсильніших гравців у світі Лі Седоля чотири гри з п'яти. У деяких іграх з неповною інформацією людина досі перемагає комп'ютер, в тому числі в Starcraft.

Микола Воронцов

Статьи

Штучний інтелект переміг професійних гравців в покер

Новости