Компанія Google представила Gemini, свою «найдосконалішу та найбільш універсальну модель штучного інтелекту на сьогодні», що може стати важливою віхою в розвитку ШІ.

Gemini, розроблений Google DeepMind, є мультимодальною моделлю, тобто може обробляти та розуміти різні типи інформації, включаючи текст, код, аудіо, зображення і відео. Вона розроблена, щоб бути гнучкою та ефективною, здатною працювати на різних пристроях — від центрів обробки даних до мобільних телефонів. Gemini поставляється в трьох версіях: Ultra, Pro та Nano, кожна з яких оптимізована для різних рівнів складності та завдань.

Ось основні особливості Gemini, на які вказує Google:

  • Висока продуктивність: компанія зазначає, що Gemini Ultra показав виняткові результати, випередивши експертів-людей у тесті MMLU і досягнувши найвищих балів у різних мультимодальних завданнях. Його здібності дозволяють йому обробляти складну інформацію з різних галузей.
  • Можливості наступного покоління: На відміну від попередніх моделей, які поєднували окремі компоненти для різних модальностей, Gemini від самого початку є мультимодальним. Це дозволяє їй більш ефективно розуміти та міркувати про різноманітні вхідні дані.
  • Масштабованість та ефективність: В Google кажуть, що Gemini – найбільш масштабована та надійна модель компанії для навчання та обслуговування. Вона працює значно швидше на спеціально розроблених тензорних процесорах (TPU), які є центральним елементом продуктів і сервісів Google зі штучним інтелектом.
  • Відповідальність і безпека: Gemini пройшов комплексну оцінку безпеки, включаючи оцінку упередженості та токсичності. В Google заявляють, що прагнуть до відповідальної розробки ШІ, враховуючи безпеку на кожному етапі та співпрацюючи із зовнішніми експертами для усунення потенційних ризиків.
  • Доступність: Gemini 1.0 розгортається на різних продуктах і платформах Google. Gemini Pro вже покращує роботу Google Bard, а Gemini Nano забезпечує нові функції в Pixel 8 Pro. Розробники та корпоративні клієнти незабаром отримають доступ до Gemini Pro через Google AI Studio та Google.

Для чат-бота Bard Gemini запускається у два етапи: починаючи відсьогодні, Bard буде використовувати спеціально налаштовану версію Gemini Pro англійською мовою для більш просунутого міркування, планування, розуміння тощо. А на початку наступного року компанія обіцяє представити Bard Advanced, який надасть користувачам доступ до найбільш досконалих моделей та можливостей, починаючи з Gemini Ultra. Судячи з усього, це буде платний сервіс на кшталт ChatGPT Plus.