Google випустила Imagen 4 — нове сімейство моделей для генерації зображень, яке без проблем працює з текстом

Євгеній Демківський - 25 червня, 17:37

Google випустила Imagen 4 — нову текстово-візуальну модель генерації зображень, яка, за словами компанії, забезпечує "значно покращене відображення тексту" порівняно з попередньою версією. Також представлено варіант Imagen 4 Ultra з підвищеною точністю відповідності до інструкцій у запиті.

Компанія вперше анонсувала нову модель на заході Google I/O у травні цього року. Тепер обидві моделі стають доступними для обмеженого тестування у Google AI Studio, а також через платну передплату API Gemini.

Звичайна версія Imagen 4 коштує $0,04 за зображення і призначена для більшості популярних завдань генерації. Ultra-версія орієнтована на більш вимогливі сценарії з точним дотриманням опису і коштує $0,06 за зображення.

У прикладах, наведених Google, Imagen 4 Ultra змогла згенерувати сторінку комікса за складним промптом і листівку в стилі ретро з пейзажем Кіото. Однак реалістичні зображення досі мають характерний "штучний" вигляд, за яким легко розпізнати, що вони створені нейромережею.

Google позиціонує Imagen 4 як прямого конкурента іншим генераторам зображень, зокрема Dall-E 3 і Midjourney 7.