Google представила велику мовну модель Gemma 3, яка може працювати на одному графічному процесорі

Дмитро Джугалик Автор новин на Mezha.Media. Пишу про те, чим сам активно захоплююся, а саме технології, ігри та кіно.

12 березня, 17:20

Google представила нову версію великої мовної моделі (LLM) з відкритим кодом Gemma 3, яку розробили на основі технологій та досліджень для Gemini 2.0. Вона здатна працювати на одному графічному процесорі або тензорному блоці обробки, перевершуючи за продуктивністю моделі від DeepSeek, OpenAI та Meta.

Нова модель має готову підтримку понад 35 мов, а також попередню підтримку понад 140 мов. Вона здатна аналізувати текст, зображення і короткі відео та пропонує контекстне вікно у розмірі 128 тисяч токенів, що дозволяє обробляти та розуміти великі обсяги даних.

Gemma 3 також підтримує виклик функцій і структурований висновок, що дозволяє автоматизувати завдання та створювати агентні системи. Крім того, модель має офіційні квантові версії, які зменшують її розмір і обчислювальні вимоги, зберігаючи високу точність.

У рейтингу Chatbot Arena Elo, який оцінює продуктивність LLM у випадкових анонімних батлах, Gemma 3 перевершує такі моделі, як DeepSeek-V3, OpenAI o3-mini, Meta Llama 405B та Mistral Large. При цьому вона працює значно ефективніше: якщо моделі DeepSeek потребують 32 прискорювачі, Gemma 3 виконує ті ж завдання (а інколи й краще) всього на одному чипі NVIDIA H100.

Google зазначає, що сімейству моделей Gemma виповнився рік і ділиться статистикою: відкриту LLM завантажили понад 100 мільйонів разів, а розробники створили понад 60 тисяч варіацій у межах екосистеми Gemmaverse.

Поділитися:

Google представила велику мовну модель Gemma 3, яка може працювати на одному графічному процесорі

Топ обговорень

Останні новини

Новини партнерів