OpenAI представила модель штучного інтелекту Sora, яка може створювати реалістичні відео з текстових підказок. Про це йдеться в офіційному повідомленні компанії.

Sora здатна генерувати відео тривалістю до хвилини, зберігаючи при цьому візуальну якість та відповідність підказкам користувача.

«Сьогодні Sora стає доступною для червоних команд, щоб оцінити критичні зони на предмет шкоди або ризиків. Ми також надаємо доступ до неї низці художників, дизайнерів і фільммейкерів, щоб отримати зворотній зв’язок про те, як удосконалити модель, щоб вона була максимально корисною для креативних фахівців», – йдеться в повідомленні OpenAI.

За твердженнями компанії, Sora здатна генерувати складні сцени з кількома персонажами, специфічними типами руху та точними деталями об’єкта і фону. Модель розуміє не лише те, про що користувач попросив у підказці, але й те, як ці речі існують у фізичному світі.

Крім того, Sora від OpenAI має глибоке розуміння мови, що дозволяє їй точно інтерпретувати підказки та створювати переконливі персонажі.

«Sora здатна генерувати цілі відео одночасно або розширювати згенеровані відео, щоб зробити їх довшими. Надаючи моделі можливість передбачати багато кадрів за раз, ми розв’язали складну проблему, яка полягала в тому, щоб об’єкт залишався таким самим, навіть коли він тимчасово зникає з поля зору», – додали в OpenAI.

Втім, слабкі місця у моделі все ж є. Вона може мати труднощі з точним моделюванням фізики складних сцен і не розуміти причинно-наслідкові зв’язки. Наприклад, людина може відкусити шматок печива, але після цього на печиві може не залишитися сліду від укусу. Водночас Sora може «плутатися» у просторі, тобто плутати праве й ліве.

OpenAI повідомила також, що в роботі над Sora компанія опікується питаннями безпеки. Для цього вона працює з експертами, зокрема в галузі дезінформації. Гігант розробляє й інструменти, які допоможуть визначити, коли відео було створено за допомогою Sora.

У компанії підкреслили, що Sora слугує основою для моделей, які можуть розуміти та імітувати реальний світ. В OpenAI вірять, що ця здатність стане важливою віхою на шляху до створення AGI.