Стартап зі штучним інтелектом, який дозволяє будь-кому за лічені секунди скопіювати голос людини, стрімко підхоплюють інтернет-тролі. Користувачі 4chan почали активно використовувати платформу синтезу голосу ElevenLabs для клонування голосів знаменитостей і зачитування аудіо — від мемів та еротики до мови ворожнечі та дезінформації.

За останні кілька років такі підробки голосів ШІ швидко вдосконалювалися, але програмне забезпечення ElevenLabs, до якого, схоже, відкрили загальний доступ, пропонує потужне поєднання швидкості, якості та доступності, а також повну відсутність запобіжних заходів.

Про зловживання програмним забезпеченням ElevenLabs вперше повідомило видання Motherboard, яке виявило на сайті 4chan постери, що поширюють згенеровані штучним інтелектом голосові кліпи, схожі на голоси відомих особистостей, зокрема Емми Вотсон і Джо Рогана:

«В одному прикладі згенерований голос, схожий на голос акторки Емми Вотсон, читає розділ з «Майн Кампф». В іншому — голос, дуже схожий на голос Бена Шарпіо, робить расистські зауваження про Александрію Окасіо-Кортес. У третьому — душать людину, яка каже, що «права трансгендерів — це права людини».

ElevenLabs позиціює своє програмне забезпечення як спосіб швидкого створення аудіодубляжа для медіа, включаючи фільми, телебачення та YouTube. Це один із багатьох стартапів у цій галузі, але він стверджує, що якість його голосів не потребує особливого редагування, що дає змогу використовувати його в додатках з дублювання іноземними мовами в режимі реального часу та миттєвого створення аудіокниг.

У своєму Твіттері Eleven Labs визнала це зловживання і заявила, що вивчатиме способи пом’якшення цих проблем. Компанія стверджує, що може «відстежити будь-яке згенероване аудіо до користувача», і вивчатиме такі заходи безпеки, як перевірка особи користувача і ручна перевірка кожного запиту на клонування голосу.