Голосові клони зі штучним інтелектом вже використовуються в подкастах і відеоіграх, але скільки часу пройде, перш ніж їх зможуть використовувати широкі верстви населення? Можливо, швидше, ніж ми думаємо, адже компанія Samsung анонсувала функцію для свого асистента Bixby, яка дозволяє користувачам клонувати свій голос, щоб відповідати на телефонні дзвінки. Ідея полягає в тому, що якщо хтось дзвонить вам, але ви не можете відповісти, ви можете набрати відповідь, і вона буде прочитана Bixby з використанням вашого голосу.

Ця функція поки доступна лише корейською мовою у розширенні Bixby Custom VoiceCreator для невеликої кількості смартфонів Samsung (нові Galaxy S23, S23+ та S23 Ultra). Якість голосу може бути жахливою, а час відгуку занадто повільним, але клонування голосу для відповіді на дзвінки цілком в рамках сучасних технологій, інструменти штучного інтелекту здатні створювати реалістичні копії голосів всього за кілька хвилин аудіозапису.

Відповіді на аудіодзвінки через текстовий інтерфейс — теж не новина. На пристроях Samsung ця функція відома як Bixby Text Call, і була представлена з фірмовою оболонкою One UI 5 для Android. Раніше вона була доступна лише корейською мовою, тепер доступна й англійською з використанням штучного голосу (і лише з версією 5.1 One UI).

Google пропонує схожу послугу під назвою Call Screen, яка дозволяє відповідати на потенційні спам-дзвінки автоматизованим голосом. Щоправда, сервіс Google дозволяє лише вибирати зі списку типових відповідей, а не вводити власні.

Неважко уявити, що ці функції стануть розумнішими та автоматизованими в найближчому майбутньому. Зрештою, ви зможете легко під’єднати свій голосовий клон до чат-бота на кшталт ChatGPT або до Microsoft Bing. Сам Samsung обіцяє, що в майбутньому голоси, згенеровані користувачами, будуть «сумісні з іншими застосунками Samsung, окрім телефонних дзвінків» – не зовсім зрозуміло, що це означає.

Технологічні компанії вже давно обіцяють, що асистенти зі штучним інтелектом зможуть здійснювати подібне адміністрування від нашого імені. Але це може створити й проблеми. Google пообіцяв подібну функціональність у своїх голосових дзвінках зі штучним інтелектом Duplex AI, вони були представлені у 2018 році як спосіб автоматичного бронювання столиків у ресторанах за допомогою голосу, створеного штучним інтелектом.

Але реакція на цю технологію була неоднозначною: багато хто критикував її як неетичну і зазначав, що вона створює більше роботи для людей, які приймають дзвінки. (Поточні амбіції Google щодо цієї технології незрозумілі, оскільки компанія закрила вебверсію Duplex наприкінці 2022 року). Існують також зловмисні випадки використання голосових клонів — від мови ненависті та харасменту до шахрайства.

Тож коли ви піднімете слухавку в найближчому майбутньому, можливо, вам доведеться запитати себе: чи справді ваш співрозмовник — людина?