Українська правда

Meta відкладає реліз моделі Behemoth через занепокоєння щодо її можливостей

- 16 травня, 15:35

Флагманську велику мовну модель (LLM) Behemoth від Meta планували випустити ще у квітні, проте компанія вже вдруге відклала реліз — цього разу до осені. За даними Reuters, затримка пов’язана із занепокоєнням розробників щодо функціональних можливостей моделі.

Інженери Meta мають труднощі у суттєвому вдосконаленні Behemoth. Усередині компанії виникають сумніви, чи є прогрес у порівнянні з попередніми моделями достатньо значущим, щоб виправдати запуск нової LLM для широкого використання.

Спочатку реліз Llama 4 Behemoth планували під час квітневої ШІ-конференції для розробників від Meta, але його перенесли на червень. Тепер компанія знову відкладає запуск моделі — щонайменше до осені, а можливо, й на пізніший термін. Meta відмовилася коментувати ці повідомлення.

У квітні Meta заявляла, що вже проводить тестування Llama 4 Behemoth та називала нову модель "однією з найрозумніших LLM у світі та нашою найпотужнішою на цей момент, яка стане вчителем для майбутніх моделей".

Натомість на початку минулого місяця компанія випустила дві інші моделі – Llama 4 Scout та Llama 4 Maverick, що за словами Meta, мають схожу продуктивність з Google Gemini 3 та GPT-4o відповідно.

Труднощі Meta з випуском нової проривної моделі відповідають загальним трендам у галузі штучного інтелекту. Розмови про нову флагманську модель GPT-5 від OpenAI йдуть ще з минулого року, однак виробник ChatGPT постійно переносить її реліз, натомість випускаючи менші версії, як-от o3 та 04-mini.

Сем Альтман, головний виконавчий директор OpenAI, на початку квітня розповідав, що для відстрочки релізу GPT-5 є багато причин, але основною є те, що компанія зможе "зробити GPT-5 набагато кращою, ніж очікувалося".

Проте у листопаді 2024 року повідомлялося, що як OpenAI, так і інші провідні компанії у галузі штучного інтелекту, мають труднощі зі створенням більш потужних LLM. Тоді ж відзначалося, що GPT-5, внутрішньо відома як Orion, не виправдовує очікувань, та за аналогією з Behemoth від Meta, не має достатньо покращень у порівнянні з чинним поколінням.

Основні труднощі полягають у тому, аби знайти достатню кількість нових даних та інформації для їх тренування. Другою основною проблемою для деяких компаній є гроші, оскільки на розробку та тренування більших моделей потрібно й значно більше ресурсів.

Load more