Дослідники з компанії Meta створили штучний інтелект, здатний грати в «Дипломатію» і перемагати більшість гравців-людей.

Як пояснюється в блозі Meta AI, «Дипломатія» десятиліттями вважалася «майже неможливим грандіозним викликом в ШІ» через набір навичок, необхідних для гри в цю гру. Мета «Дипломатії» – контролювати більшу частину дошки, але для цього гравці ведуть переговори один з одним за допомогою розмов, формують альянси, укладають угоди та виявляють, коли інші гравці блефують.

Meta прийняла виклик, створивши та навчивши ШІ під назвою CICERO, який входить в найкращі 10% гравців в «Дипломатію», що зіграли більше однієї гри (на сайті webDiplomacy.net) Цього вдалося досягти завдяки поєднанню двох різних напрямків досліджень ШІ: стратегічного мислення та обробки природної мови.

ШІ формується з керованої моделі діалогу та механізму стратегічного мислення, які працюють разом. Це дозволяє CICERO передбачати кроки, які можуть зробити інші гравці, а також кроки, які, на думку цих гравців, зробить CICERO (стратегічне міркування). Потім CICERO використовує набір ретельно підібраних планів, на яких будує свої розмови з іншими гравцями, щоб «вести переговори, давати поради, обмінюватися інформацією та укладати угоди» (обробка природної мови).

ШІ, здатний перемагати найкращих гравців в такі ігри, як шахи, покер і го, навчають за допомогою навчання з підкріпленням власної гри. Оскільки «Дипломатія» вимагає співпраці з гравцями-людьми, цей метод не працює. Зазвичай для таких ігор використовується навчання під наглядом, але Meta каже, що це створює «відносно слабкого і дуже зручного для використання» супротивника. Замість цього Meta використовує ітеративний алгоритм планування, який балансує між послідовністю діалогу і раціональністю.

CICERO далекий не досконалий і може генерувати непослідовні діалоги, але він досить хороший, щоб кинути серйозний виклик навіть найкращим гравцям. Втім, у Meta вважають, що технологія, розроблена при створенні цього ШІ, може бути використана і в інших сферах. Наприклад, дозволити голосовим помічникам вести з нами довгі розмови та навчати нас новим навичкам. Крім того, такий ШІ може бути використаний у відеоіграх для виконання ролі реалістичних персонажів, яких важко відрізнити від гравців-людей.