Нова ШІ-модель NVIDIA може створити звук на основі текстового запиту

NVIDIA_Arm

Дмитро Джугалик Автор новин на Mezha.Media. Пишу про те, чим сам активно захоплююся, а саме технології, ігри та кіно.

26 листопада 2024, 15:28

NVIDIA представила Foundational Generative Audio Transformer Opus 1 або ж Fugatto, нову модель штучного інтелекту, що може створювати або змінювати будь-яку суміш музики, голосів та звуків. Компанія називає цю модель швейцарським ножем для звуку.

У блог пості компанія розповідає про можливості нової моделі. Зокрема Fugatto зможе створити музичний фрагмент на основі текстового запиту, видалити або додати інструменти з наявної пісні, змінити акцент чи емоцію в голосі або ж навіть "створити звуки, яких раніше не чули".

Як заявляє NVIDIA, Fugatto є першою генеративною моделлю ШІ, що демонструє емерджентні властивості – можливості, які виникають у результаті взаємодії різних навчених здібностей та здатність поєднувати інструкції у вільній формі. Зокрема модель може згенерувати гавкіт труби чи нявкання саксофона.

На додачу до цього, компанія зазначає, що нова модель здатна виконувати завдання, на які її не тренували. Наприклад, за допомогою певних налаштувань і невеликої кількості співочих даних Fugatto може генерувати високоякісний вокал.

Поділитися:

Нова ШІ-модель NVIDIA може створити звук на основі текстового запиту

Топ обговорень

Останні новини

Новини партнерів