OpenAI представила новий інструмент для клонування голосу, Voice Engine, який зараз перебуває у стадії тестування і дозволяє клонувати голоси з 15-секундного аудіозразка. Однак дата публічного релізу інструменту залишається невизначеною, оскільки OpenAI поки що оцінює потенційне зловживання цією технологією.

Голосовий рушій, який розробляється вже близько двох років, використовує генеративну модель ШІ, що також вбудована в голосові можливості ChatGPT та API перетворення тексту в мову OpenAI. Spotify використовує цю модель з початку вересня для дублювання подкастів різними мовами. Її навчальні дані, що є поєднанням ліцензованих і загальнодоступних джерел, залишаються ретельно охоронюваною таємницею через конкурентні та юридичні міркування.

Зразок голосу:

Згенерований зі зразка голос:

Поки що OpenAI вживає заходів для забезпечення етичного використання Voice Engine, включаючи маркування клонованих голосів спеціальними знаками з нечутними для людського вуха ідентифікаторами та обмеження початкового доступу для обраної групи розробників, які зосереджуються на низько ризикованих, соціально корисних випадках використання. Компанія також вимагає від користувачів отримувати явну згоду від осіб, чиї голоси клонуються, і розкривати інформацію про те, коли голоси генеруються за допомогою штучного інтелекту.

Зразок голосу англійською:

Згенерований переклад німецькою:

Втім поява досконалої технології клонування голосу створює потенційні загрози для заробітку акторів озвучки та викликає занепокоєння щодо створення переконливих підробок, які можуть використовуватися для шахрайських схем.

Дорожня карта OpenAI для Voice Engine передбачає подальше посилення безпеки та потенційно ширший доступ, залежно від результатів пілотної програми та розробки ефективних засобів захисту.