Google представив свою нову модель генеративного штучного інтелекту Veo. Компанія продемонструвала її на конференції Google I/O та заявила, що вона здатна створювати з текстових запитів відео у роздільній здатності 1080р тривалістю близько хвилини.
Veo має "поглиблене розуміння природної мови", що дозволяє моделі розуміти кінематографічні терміни, такі як "таймлапс" або "аерофотозйомка ландшафту".
Google стверджує, що отримані відео є "більш послідовними та узгодженими", зображуючи більш реалістичний рух людей, тварин та об'єктів у кадрі. Компанія не вказала, що саме є менш послідовним, ніж відео Veo, можливо, маються на увазі попередні моделі Google, а, може, – Sora від OpenAI.
Користувачі зможуть вносити правки до вже згенерованих відео. Керівник Google Deep Mind Деміс Хасабіс повідомив на конференції, що в компанії вже працюють над створенням розкадровок до відео та подовженням хронометражу.
Veo доступна для користувачів у межах сервісу VideoFX, який, на жаль, поки недоступний на території України. Google також планує додати деякі зі своїх можливостей до YouTube Shorts "у майбутньому".