Google запустила функцію генерації зображень у Gemini 2.0 Flash, яка дозволяє моделі самостійно створювати та редагувати зображення. Користувачі швидко виявили, що модель здатна генерувати й анімувати реалістичні зображення відомих осіб, створюючи діпфейки, а також видаляти водяні знаки зі стокових зображень. Про це пише TechCrunch.
Gemini не просто видаляє водяні знаки, а непомітно заповнює прогалини, які виникають після їх видалення. Хоча існують й інші інструменти на основі штучного інтелекту, які виконують подібні завдання, Gemini 2.0 Flash має перевагу в тому, що вона є безплатною.
Функція генерації зображень у Gemini 2.0 Flash наразі позначена як "експериментальна" та "не для виробничого використання" і доступна тільки в інструментах Google для розробників, таких як AI Studio. Вона має й деякі недоліки: моделі важко працюють з напівпрозорими водяними знаками та дуже великими водяними знаками.
Деякі власники авторських прав, ймовірно, будуть незадоволені відсутністю обмежень на використання Gemini 2.0 Flash. До речі, найпопулярніші конкуренти Gemini, такі як Claude 3.7 Sonnet від Anthropic та GPT-4o від OpenAI, прямо відмовляються від видалення водяних знаків. Claude навіть називає видалення водяного знаку з зображення "неетичним і потенційно незаконним".