Ізраїльська компанія Deepdub представила свій новий онлайн-сервіс для перекладу відеоконтенту іншими мовами за допомогою алгоритмів з елементами штучного інтелекту та машинного навчання. Компанія використовує нейронні мережі для генерації промови акторів з фільмів, телешоу, ігор та рекламних роликів.

Штучний інтелект обробляє голоси, потім перекладає їх іншою мовою, зберігаючи при цьому тембр, ритм, інтонацію та інші важливі голосові нюанси. Таким чином, Морган Фрімен може розмовляти у фільмах навіть японською мовою — та ще й так, ніби це його рідна мова.

Deepdub має намір розв’язати всі проблеми в галузі озвучування та дубляжу фільмів. Згідно зі статистикою компанії Aberdeen, для створення п’ятихвилинного дубля потрібна одна година роботи у професійній студії. Але якщо дубльований голос має максимально точно відповідати голосу оригінального актора, цей час збільшується більш ніж удвічі.

Вартість таких послуг становить значну частину бюджету кінематографістів та розробників комп’ютерних ігор. Одна хвилина голосу за кадром іноземною мовою коштує близько $75, і це найнижча ставка для дуже простих відеороликів.

Стартап пропонує універсальне рішення для створення таких дубляжів, які можна використовувати на міжнародному рівні та серйозно скоротити витрати на перекладачів. Використовуючи синтетичні голоси, засновані на різних оригінальних зразках голосів акторів, стартап озвучує промови з фільмів, ігор та реклами.

Deepdub особливо наголошує, що їхній алгоритм, з елементами штучного інтелекту, говорить буквально голосом оригіналу, і глядачі можуть насолоджуватися фільмом у тому ж вигляді, саме так, як його задумав режисер і виконав актор.