DALL-E, а також DALL-E 2 — це моделі штучного інтелекту, які розроблені компанією OpenAI та призначені для створення цифрових зображень на основі описів природною мовою. OpenAI додав нову функцію «outpointing» до DALL-E, яка дозволяє системі створювати нові візуальні ефекти, що розширюють межі будь-якого зображення, повідомляє видання The Verge.

DALL-E за допомогою людських підказок «уявляє» те, що знаходиться поза портретом Йоганнеса Вермера «Дівчина з перловою сережкою». Цікаво, що навіть з обмеженої інформації система може відповідати стилю Вермера, імітуючи тіні та відблиски оригіналу.

На покадровій зйомці можна побачити, як художник Август Камп розширював зображення на невеликі частини за раз, часто переробляючи згенеровані DALL-E зображення, щоб отримати бажаний результат. Система не генерує ці розширення сама по собі: як і в будь-якому штучному інтелекті, який перетворює текст у зображення, ця модель вимагає, щоб люди описували візуальні ефекти.

Замальовування як функцію можна використовувати для розширення оригінального вмісту, але, звісно, ​​багато користувачів DALL-E використовували цю можливість в карикатурних цілях.

З ширшої точки зору, замальовування насправді не розширює базову функціональність систем штучного інтелекту такого типу. Втім, воно показує, як OpenAI, ймовірно, буде позиціювати себе на зростаючому ринку цих систем, зробивши зручність використання ключовим фактором для клієнтів.

Багато моделей штучного інтелекту для перетворення тексту в зображення можуть виконувати ту ж важливу функцію, що й замальовування, але, як і сам DALL-E до цього оновлення, це вимагає чимало ручних маніпуляцій. Зробити замальовування максимально простим допоможе DALL-E виділитися серед зростаючої конкуренції менших систем, таких як Midjourney і Stable Diffusion.

Сама DALL-E доступна через програму бета-тестування, до якої поки що мають доступ понад мільйон користувачів. Кожен користувач бета-версії отримує 50 безплатних генерацій зображень протягом першого місяця, а потім 15 додаткових використань щомісяця. Згодом можна згенерувати 115 додаткових зображень за $15.