У той час як ШІ на реальних дорогах все ще водить недосконало, у грі він робить це неперевершено. Sony AI розробили Gran Turismo Sophy – програму для керування автомобілями у світі Gran Turismo, яка змогла здивувати його кращих гравців. 

Gran Turismo – відеогра, яка суперреалістично симулює автомобільні перегони. Провівши серію випробувань, Sony AI навчили штучний інтелект перемагати її чемпіонів за різних умов. Так, програма обійшла численну переможницю перегонів Емілі Джонс на 1,5 секунди. Це вічність у грі, де все вирішують мілісекунди переваги. 

Проте не лише швидкість була потрібна ШІ для перемоги. Порожню трасу GT Sophy проходила з рекордною швидкістю, однак у груповому змаганні з кількома водіями-людьми, де був потрібен інтелект, вона спершу програла. Часом програма була надто агресивною, отримуючи штрафи, а часом – надто боязкою. 

Sony врахувала помилки та перевчила штучний інтелект, організувавши згодом матч-реванш. Цього разу GT Sophy з легкістю залишила всіх позаду. Що змінилось? Програмі надали те, що керівник Sony AI називає «етикетом» – можливість балансувати агресію з обережністю та обирати поведінку, найбільш відповідну до ситуації.  

Це робить GT Sophy актуальною й поза треками Gran Turismo. Етикет між водіями на трасі є конкретним прикладом динамічної поведінки, що залежить від контексту. Такої поведінки очікують від роботів під час взаємодії з людьми. Усвідомлення, коли краще ризикувати, а коли стриматись, буде корисним для безпілотних автомобілів, на виробництві та у домашніх роботах. 

Як перемагала GT Sophy?

Замість того, щоб зчитувати пікселі з екрана подібно до гравців-людей, програма отримувала оновлення щодо положення автомобіля на трасі та автомобілів довкола під час перегонів. Оновлення відбувались 10 разів на секунду, що відповідає людській реакції. 

GT Sophy також отримувала дані про віртуальні фізичні сили, які діють на автомобіль. Gran Turismo – дуже реалістична симуляція, що імітує аеродинаміку автомобіля, тертя шин об трек та інші фізичні явища. Програма навчилася грати на межі можливого, виконуючи трюки, на які люди не могли наважитись. Наприклад, виходила колесом на траву біля краю траси, ковзаючи у поворотах. 

«Ви не хочете цього робити, бо ви помилитесь. Це як контрольована аварія. Можливо, я змогла би так зробити один раз зі ста», – говорить Емілі Джонс.  

Програма швидко вивчила фізику гри, тому на другому етапі завданням Sony було навчити ШІ уникати штрафів за небезпечне водіння. З цим розробники також впорались.