Google активно використовує контент із великої бібліотеки YouTube для тренування власних моделей штучного інтелекту, таких як Gemini та новий генератор відео й аудіо Veo 3. Про це повідомляє CNBC із посиланням на власні джерела.
Один зі співрозмовників видання розповів, що для тренування застосовують добірку з каталогу у 20 мільярдів роликів. У Google підтвердили цю інформацію, однак уточнили, що йдеться лише про частину контенту й у межах угод із творцями та медіакомпаніями.
Представник YouTube пояснив, що компанія завжди використовувала власний контент для покращення сервісів — поява генеративного ШІ цього не змінила. "Ми розуміємо важливість гарантій, тому розробили надійні механізми захисту для творців", — зазначили в компанії.
Проте експерти побоюються наслідків для авторських прав. Вони вважають, що використання чужих відео для тренування ШІ без відома їхніх творців може спричинити кризу в галузі інтелектуальної власності. Хоч YouTube каже, що раніше розповідав про це, більшість творців навіть не знали, що їхній контент використовується для тренування.
Google не розкриває, скільки відео застосували для тренування моделей. Але навіть якщо йдеться про 1% бібліотеки, це більше ніж 2,3 мільярда хвилин контенту — у 40 разів більше, ніж у конкурентів.
Творці, завантажуючи ролики, надають YouTube широкий дозвіл на використання контенту. Водночас можливості відмовитися від тренування своїх відео для власних моделей Google немає.
Представники компаній, що захищають цифрові права, вважають, що багаторічна праця творців використовується для розробки ШІ без винагороди або навіть повідомлення. Наприклад, компанія Vermillio створила сервіс Trace ID, що визначає схожість створених ШІ-роликів з оригінальним контентом. В окремих випадках відповідність сягала понад 90%.
Окремі творці не проти тренування на їхньому контенті, розглядаючи нові інструменти як можливість для експериментів. Але більшість вважають, що ситуація непрозора та потребує чіткіших правил.
YouTube навіть уклав угоду з Creative Artists Agency, аби розробити систему управління ШІ-контентом, який імітує відомих людей. Однак механізми видалення або відстеження схожого контенту все ще недосконалі.
Тим часом у США вже звучать заклики надати авторам юридичний захист, який дозволив би їм контролювати використання своєї творчості у світі генеративного ШІ.
Нагадаємо, нещодавно компанія Google змінила внутрішні правила модерації контенту на YouTube — тепер відео, що частково порушують правила, можуть залишатися онлайн, якщо їх вважають суспільно важливими.