Google впоралась із генерацією написів у новій моделі Imagen 4

Євгеній Демківський - 21 травня, 12:59

Під час конференції Google I/O компанія анонсувала Imagen 4 — нову версію своєї моделі генерації зображень. У Google її називають "вражаюче точною" та "значно кращою у відтворенні тексту", що відкриває нові можливості для створення листівок, коміксів, постерів та іншого візуального контенту.

Як зазначив віцепрезидент Google DeepMind Елі Коллінз, Imagen 4 поєднує швидкість із точністю та демонструє "надзвичайну чіткість у дрібних деталях", зокрема в текстурах тканин, краплях води чи хутрі тварин. При цьому модель працює не лише у фотореалістичному, а й в абстрактному стилі. На прикладах Google помітно чітке відображення об’єктів і тексту навіть у дрібних шрифтах.

Imagen 4 вже доступна у додатках Gemini, Whisk, Vertex AI, а також у Workspace — включно з Google Slides, Docs і новим відеоредактором Google Vids. Крім того, компанія готує пришвидшену версію моделі, яка, за її словами, працюватиме до 10 разів швидше за Imagen 3.

Google позиціонує Imagen 4 як один з інструментів, тісно інтегрованих з екосистемою Gemini — зокрема для створення ілюстрацій у відповідь на текстові запити, генерації матеріалів для презентацій чи персоналізованого контенту у Workspace.

До речі, цього року Google також представила на I/O новий тарифний план AI Ultra за $250 на місяць, функцію живого перекладу в реальному часі в Google Meet та ШІ-інструмент для створення дизайнів інтерфейсів Stitch. Крім цього компанія анонсувала інтеграцію Gemini у браузер Chrome й розповіла про розробку розумних окулярів Project Aura на базі Android XR.