За словами правозахисних організацій, від акторів дубляжу все частіше просять підписати права на свої голоси, щоб клієнти могли використовувати штучний інтелект для створення синтетичних версій, які з часом можуть їх замінити, причому інколи без додаткової компенсації.

Ці контрактні зобов’язання — лише одне з багатьох занепокоєнь акторів у зв’язку розвитку ШІ, що генерує голоси, який, за їхніми словами, загрожує витіснити цілі сегменти індустрії з ринку праці.

Ця новина підкреслює вплив наростальної індустрії голосів, згенерованих штучним інтелектом. Нещодавно повідомлялося про те, як учасники 4chan швидко взяли бета-версію програми від компанії ElevenLabs, що займається розробкою штучних голосів, і використали її для створення голосів знаменитостей, зокрема Емми Вотсон, яка читала розділи з «Майн кампф». Наслідки для індустрії озвучування безпосередньо пов’язані з роботою ElevenLabs, оскільки компанія просуває свою послугу як опцію для ігор, фільмів, аудіокниг тощо.

Зараз існує багато компаній, які пропонують клонувати, генерувати або синтезувати чийсь голос за допомогою штучного інтелекту, і всі вони працюють приблизно однаково. Спочатку користувачі можуть записати свій голос за допомогою скрипту, наданого компанією. Після запису певної кількості аудіо, іноді від 10 до 60 хвилин, компанія створює репліку голосу користувача. Потім він може написати будь-який довільний текст, а система прочитає його синтезованою версією його ж голосу. Вартість цих послуг часто дуже низька.

Деякі сайти також дозволяють користувачам завантажувати раніше записане аудіо, а це означає, що можна копіювати записи інших людей, а потім синтезувати їх без відома чи згоди людини.

Повідомляється, що багато акторів дубляжу могли підписати контракт, не знаючи, що до нього було додано подібні формулювання. Також у контрактах на несинтетичне озвучення є пункти, які передають права на використання голосу актора для навчання або створення синтетичного голосу без будь-якої додаткової компенсації або схвалення. Деяким акторам кажуть, що вони не можуть бути найняті без згоди з цими пунктами.

На своєму сайті ElevenLabs заявляє, що хоче зробити багатомовну аудіопідтримку на вимогу сучасного стану речей в освіті, потоковому мовленні, аудіокнигах, іграх, фільмах і навіть розмовах у реальному часі, і має інструменти, які забезпечують необхідну якість для озвучення новин, інформаційних бюлетенів, книг і відео.