Метью Батерік – письменник, дизайнер, програміст і юрист. У листопаді минулого року Метью разом з групою адвокатів подав позов проти GitHub Copilot за його «безпрецедентне піратство програмного забезпечення з відкритим кодом». Судовий процес досі триває.

Цього разу його зацікавили нейромережі для генерації зображень. Митці у всьому світі стурбовані тим, що такі системи штучного інтелекту навчаються на величезній кількості їхніх робіт, захищених авторським правом, без згоди, без зазначення авторства і без компенсації.

13 січня Метью Батерік разом з художниками Сарою Андерсен, Келлі МакКернан і Карлою Ортіс і за підтримки юристів подали колективний позов проти Stability AI, розробника генератора зображень Stable Diffusion, та платформи для митців DeviantArt за використання Midjourney – ще одного інструменту на основі ШІ для створення зображень, який для навчання використовував твори мільйонів художників.

«Компанії-генератори зображень чітко висловили свою позицію. Тепер вони можуть почути думку митців», – повідомляє Метью Батерік в анонсі судового позову.

Позивачі впевнені, що штучний інтелект має бути справедливим та етичним для всіх.

Stable Diffusion – це програмний продукт на основі штучного інтелекту, випущений у серпні 2022 року компанією Stability AI. Батерік стверджує, що він містить несанкціоновані копії мільйонів – а, можливо, й мільярдів — захищених авторським правом зображень. Ці копії нібито були зроблені без відома чи згоди авторів.

«Навіть якщо припустити, що номінальна сума збитків становить $1 за зображення, вартість цього незаконного привласнення становитиме приблизно $5 мільярдів. (Для порівняння, найбільшою крадіжкою творів мистецтва в історії була крадіжка 13 робіт з Музею Ізабелли Стюарт Гарднер у 1990 році, нині їхня вартість оцінюється в $500 мільйонів)», – міркує Батерік.

Метод дифузії з використанням нейромережі був винайдений у 2015 році дослідниками ШІ зі Стенфордського університету. На діаграмі нижче, взятій з дослідження Стенфордської команди, показано дві фази процесу дифузії з використанням навчальних даних у формі спіралі.

Група художників та юристів подали позов проти Stable Diffusion та DeviantArt

Простіше кажучи, дифузія — це спосіб, за допомогою якого програма штучного інтелекту з’ясовує, як відновити копію навчальних даних за допомогою денойзинга. Оскільки це так, з точки зору авторського права це нічим не відрізняється від MP3 або JPEG – способу зберігання стислої копії певних цифрових даних, вважають позивачі.

У 2020 році дослідники з Каліфорнійського університету в Берклі вдосконалили метод дифузії двома способами:

  1. Вони показали, як дифузійна модель може зберігати свої навчальні зображення в більш стислому форматі, не впливаючи на її здатність відтворювати високоточні копії. Ці стислі копії навчальних зображень відомі як латентні зображення.
  2. Дослідники виявили, що ці латентні зображення можна інтерполювати — тобто, змішувати математично — для отримання нових похідних зображень.

На діаграмі нижче, взятій з дослідження команди Берклі, показано, як працює цей процес:

Група художників та юристів подали позов проти Stable Diffusion та DeviantArt

Зображення в червоній рамці було інтерпольоване з двох «вихідних» зображень піксель за пікселем. Виглядає як два напівпрозорих зображення обличчя, накладених одне на одне, а не єдине переконливе обличчя.

Зображення в зеленій рамці було згенеровано по-іншому. У цьому випадку два вихідні зображення були стиснуті в латентні зображення. Після того, як ці латентні зображення були інтерпольовані, це нове інтерпольоване латентне зображення було реконструйовано в пікселі за допомогою процесу згладжування.

Попри різницю в результатах, з точки зору авторського права, ці два способи інтерполяції еквівалентні: вони обидва створюють похідні роботи шляхом інтерполяції двох вихідних зображень.

У 2022 році дослідники з Мюнхена вдосконалили техніку дифузії. Вони з’ясували, як керувати процесом знебарвлення за допомогою додаткової інформації. Цей процес називається кондиціонуванням. (Один з цих дослідників, Робін Ромбах, зараз працює в Stability AI як розробник Stable Diffusion).

Stability AI, заснована Емадом Мостаком, базується в Лондоні. Компанія фінансує LAION, німецьку організацію, яка створює дедалі більші набори даних зображень для використання компаніями, що займаються штучним інтелектом.

Батерік припускає, що тисячі або, можливо й мільйони, зображень у LAION були скопійовані з DeviantArt і використані для навчання Stable Diffusion.

Позивачі також звинувачують DeviantArt в тому, що замість того, щоб стати на захист своєї спільноти художників, платформа вирішила випустити платний застосунок DreamUp, побудований на основі Stable Diffusion. Своєю чергою, потік мистецтва, створеного штучним інтелектом, заполонив DeviantArt, витісняючи художників-людей.