На конференції I/O 2025 компанія Google анонсувала нову модель штучного інтелекту Gemma 3n, яка може працювати безпосередньо на мобільних пристроях, ноутбуках і планшетах. Про це пише TechCrunch.
Як зазначає компанія, модель здатна обробляти текст, зображення, аудіо та відео й може функціонувати навіть на пристроях з менше ніж 2 ГБ оперативної пам’яті. Вона побудована на тій самій архітектурі, що й Gemini Nano, та розрахована на локальну роботу без підключення до хмари. Це знижує витрати на обчислення і водночас підвищує рівень конфіденційності, оскільки дані користувача не передаються на зовнішні сервери.
Крім того, Google презентувала MedGemma — відкриту модель, призначену для аналізу медичних зображень та текстів. Вона стала частиною програми Health AI Developer Foundations і допоможе розробникам створювати додатки для медичної сфери з глибшим розумінням контенту.
Ще одним важливим анонсом стала модель SignGemma, що перекладає жестову мову у текст. Зараз вона найкраще підтримує американську жестову мову (ASL) та англійську мову. Google сподівається, що SignGemma допоможе розробникам створювати корисні інструменти для людей з вадами слуху.
Моделі Gemma мають заплутану систему ліцензування, а умови Google відрізняються від типових, через що деякі розробники вважають їхнє використання у комерційних проєктах потенційно ризикованим. Попри це, Gemma вже була завантажена десятки мільйонів разів.
Менеджер продукту Gemma в Google, Гас Мартінс, наголосив, що компанія й надалі розвиватиме ці моделі та забезпечуватиме їхню відкритість для спільноти розробників.
До речі, окрім Gemma 3n, на конференції I/O компанія Google також представила новий тарифний план AI Ultra за $250 на місяць, функцію перекладу в реальному часі в Google Meet, новий ШІ-інструмент для створення інтерфейсів Stitch, смартокуляри у співпраці з Xreal, автоматичне створення надійних паролів в Chrome та нове покоління генератора зображень Imagen 4.