Google розширив можливості свого штучного інтелекту Gemini, додавши функцію завантаження аудіофайлів, пише Android Police. Раніше чат-бот від Google працював тільки з зображеннями, PDF-документами та відео, але тепер він зможе обробляти і звукові файли.
Про запуск нової опції повідомив віцепрезидент Google Labs і Gemini Джош Вудворд, назвавши її "запитом №1" від користувачів. Функція вже доступна на Android, iOS та у вебверсії. Підтримуються формати MP3, WAV та інші поширені типи аудіо. Завантаження здійснюється через стандартну кнопку "Завантажити файли".
Для користувачів безкоштовного тарифу встановлено обмеження: можна передати до 10 файлів одночасно, але сумарна тривалість усіх аудіозаписів не повинна перевищувати 10 хвилин. Користувачі платних тарифів Gemini Advanced (AI Pro або AI Ultra) отримують значно більший ліміт — до трьох годин аудіо.
Для порівняння, відеофайли у безкоштовній версії обмежені п’ятьма хвилинами, а у платних — однією годиною. Таким чином, для аудіо безкоштовний ліміт удвічі більший, а у платних тарифах — утричі.
Додавання цієї функції наближає Gemini до конкурентів, зокрема ChatGPT від OpenAI, який підтримує завантаження та розшифрування аудіо вже кілька місяців.