Якість голосів, згенерованих штучним інтелектом, стрімко покращилася за останні роки, але все ще залишаються аспекти людського мовлення, які не піддаються синтетичній імітації. Звичайно, ШІ-актори можуть озвучувати презентації та рекламні ролики, але складніші постановки — наприклад, переконливе виконання ролі Гамлета — залишаються недосяжними.

Стартап Sonantic, який займається розробкою голосового ШІ, заявляє, що створив синтетичний голос, який може виражати такі тонкощі, як піддражнювання і флірт. Компанія заявляє, що ключ до її успіху це включення немовних звуків в аудіо, навчання своїх ШІ-моделей відтворювати невеликі затримки дихання (крихітні насмішки та напівприховані хихикання), які надають реальній мові печатку біологічної автентичності.

«Ми вибрали любов як загальну тему, — розповідає співзасновник і технічний директор Sonantic Джон Флінн. — Але наша мета дослідження полягала в тому, щоб побачити, чи зможемо ми змоделювати тонкі емоції. Більші емоції трохи легше вловити».

Генеральний директор Sonantic Зіна Куреші описує програмне забезпечення компанії як «фотошоп для голосу». Його інтерфейс дозволяє користувачам вводити мову, яку вони хочуть синтезувати, вказувати настрій виступу, а потім вибирати з набору голосів штучного інтелекту, більшість з яких скопійовані з реальних акторів-людей. Це аж ніяк не унікальна пропозиція (конкуренти, такі як Descript, продають подібні пакети), але Sonantic стверджує, що їхній рівень кастомізації є глибшим, ніж у конкурентів.

Емоційний вибір для передачі включає гнів, страх, смуток, щастя і радість, а з останнім оновленням — кокетство, сором’язливість, піддражнювання і хвалькуватість. Режим «режисера» дозволяє ще більше налаштувань: можна регулювати висоту голосу, збільшувати або зменшувати інтенсивність подачі, а також вставляти маленькі немовні вокалізації, такі як сміх і вдихи.

Стартап Sonantic створив ШІ-голос, здатний фліртувати
Програмне забезпечення Sonantic дозволяє налаштовувати подачу мови, згенерованої штучним інтелектом

Вибір Sonantic жіночого голосу був натхненний фільмом Спайка Джонзе «Вона» 2013 року, де головний герой закохується в ШІ-асистента Саманту. Компанія заявила, що визнає етичні проблеми, які супроводжують розвиток нових технологій, і що вона обережно ставиться до того, як і де вона використовує свої голоси штучного інтелекту.