Українська правда

Alibaba заявляє, що оновлена ШІ-модель Qwen3 випереджає OpenAI та DeepSeek у математиці та програмуванні

Alibaba заявляє, що оновлена ШІ-модель Qwen3 випереджає OpenAI та DeepSeek у математиці та програмуванні
0

Alibaba представила оновлення для ШІ-моделі Qwen3-235B-A22B, яка показала вищі результати у тестах з математики та кодування порівняно з аналогами від OpenAI та DeepSeek. Нова версія вже доступна на Hugging Face та ModelScope, пише South China Morning Post.

У тесті American Invitational Mathematics Examination 2025 модель набрала 70,3 бала, тоді як DeepSeek-V3 — 46,6, а GPT-4o — 26,7. У тесті на кодування MultiPL-E Qwen досягла 87,9 бала, обійшовши OpenAI (82,7) і DeepSeek (82,2), але поступившись Claude Opus 4 Non-thinking від Anthropic (88,5).

Оновлення моделі також передбачає підтримку до 256 тис. токенів та режим "non-thinking" — без явної логічної побудови відповіді. Водночас нова модель буде інтегровано в "розумного" асистента HP Xiaowei Hui на ПК у Китаї.

Qwen3, представлена у квітні, включає моделі з від 600 млн до 235 млрд параметрів. За оцінкою LMArena, Qwen 3-235B-A22B-no-thinking посідає третє місце серед open-source LLM, поступаючись лише китайським Kimi K2 (Moonshot AI) та DeepSeek R1-0528. У рейтингу Hugging Face три з десяти топових китайських моделей — з серії Qwen.

Загалом, за оцінками LMArena, китайські відкриті LLM зараз випереджають західних конкурентів, від таких компаній, як-от Meta та Google. 

До речі, генеральний директор NVIDIA Дженсен Хуанг, під час візиту до Китаю, назвав моделі від Alibaba, DeepSeek і Moonshot "одними з найкращих у світі" та "дуже прогресивними".

Поділитися:
Посилання скопійовано
Реклама:
Реклама: