NVIDIA представила Foundational Generative Audio Transformer Opus 1 або ж Fugatto, нову модель штучного інтелекту, що може створювати або змінювати будь-яку суміш музики, голосів та звуків. Компанія називає цю модель швейцарським ножем для звуку.
У блог пості компанія розповідає про можливості нової моделі. Зокрема Fugatto зможе створити музичний фрагмент на основі текстового запиту, видалити або додати інструменти з наявної пісні, змінити акцент чи емоцію в голосі або ж навіть "створити звуки, яких раніше не чули".
Як заявляє NVIDIA, Fugatto є першою генеративною моделлю ШІ, що демонструє емерджентні властивості – можливості, які виникають у результаті взаємодії різних навчених здібностей та здатність поєднувати інструкції у вільній формі. Зокрема модель може згенерувати гавкіт труби чи нявкання саксофона.
На додачу до цього, компанія зазначає, що нова модель здатна виконувати завдання, на які її не тренували. Наприклад, за допомогою певних налаштувань і невеликої кількості співочих даних Fugatto може генерувати високоякісний вокал.