Китайський технологічний гігант Alibaba представив нові моделі штучного інтелекту Qwen3. Компанія стверджує, що ці моделі можуть зрівнятися або навіть перевершити останні розробки від Google та OpenAI. Моделі мають від 0,6 до 235 мільярдів параметрів і доступні для завантаження на Hugging Face та GitHub.
Qwen3 є "гібридними" моделями, що поєднують швидкість виконання простих завдань та здатність до складного "мислення" для перевірки фактів. Частина моделей використовує архітектуру Mixture of Experts для покращення ефективності.
Моделі підтримують 119 мов і були навчені на даних з підручників, кодів та контенту, згенерованого попередніми моделями. Нове покоління Qwen показує значні покращення в тестах. Хоча жодна з моделей Qwen3 не перевершує найновіші розробки OpenAI, такі як o3 і o4-mini, вони все ж демонструють сильні результати, зокрема перевершуючи OpenAI o1 в деяких тестах.
За словами Alibaba, Qwen3 вирізняється своєю здатністю точно виконувати інструкції. До речі, експерти відзначають, що Qwen3, як і інші відкриті моделі, може стати важливим інструментом для Китаю на фоні обмежень на імпорт чипів для тренування ШІ.