Alibaba представила нові моделі штучного інтелекту Qwen3 з "міркуванням"

Євгеній Демківський Автор новин Mezha.Media та гік. Пишу про технології, кіно та ігри. Можливо, про ігри з трохи більшою пристрастю.

29 квітня, 12:30

Китайський технологічний гігант Alibaba представив нові моделі штучного інтелекту Qwen3. Компанія стверджує, що ці моделі можуть зрівнятися або навіть перевершити останні розробки від Google та OpenAI. Моделі мають від 0,6 до 235 мільярдів параметрів і доступні для завантаження на Hugging Face та GitHub.

Introducing Qwen3!

We release and open-weight Qwen3, our latest large language models, including 2 MoE models and 6 dense models, ranging from 0.6B to 235B. Our flagship model, Qwen3-235B-A22B, achieves competitive results in benchmark evaluations of coding, math, general… pic.twitter.com/JWZkJeHWhC
— Qwen (@Alibaba_Qwen) April 28, 2025

Qwen3 є "гібридними" моделями, що поєднують швидкість виконання простих завдань та здатність до складного "мислення" для перевірки фактів. Частина моделей використовує архітектуру Mixture of Experts для покращення ефективності.

Моделі підтримують 119 мов і були навчені на даних з підручників, кодів та контенту, згенерованого попередніми моделями. Нове покоління Qwen показує значні покращення в тестах. Хоча жодна з моделей Qwen3 не перевершує найновіші розробки OpenAI, такі як o3 і o4-mini, вони все ж демонструють сильні результати, зокрема перевершуючи OpenAI o1 в деяких тестах.

За словами Alibaba, Qwen3 вирізняється своєю здатністю точно виконувати інструкції. До речі, експерти відзначають, що Qwen3, як і інші відкриті моделі, може стати важливим інструментом для Китаю на фоні обмежень на імпорт чипів для тренування ШІ.

Поділитися:

Alibaba представила нові моделі штучного інтелекту Qwen3 з "міркуванням"

Топ обговорень

Останні новини

Новини партнерів