NVIDIA без дозволу використовує відео з YouTube та Netflix для навчання свого штучного інтелекту. 404 Media отримало доступ до витоку внутрішніх документів (доступ за підпискою), про це пише Engadget.

Зазначається, що працівники ШІ-відділу NVIDIA отримали вказівку завантажувати відео з YouTube, Netflix та інших відеохостингів для розробки комерційних ШІ-проєктів. Певно, технологічний гігант вважає, що не має часу “грати за правилами”, особливо коли конкуренти також не сплять.

Як повідомляється, мета збору відеоматеріалів була у розробці моделей для таких продуктів, як генератор 3D світу Omniverse, самокеровані автомобільні системи та проєкт “digital human”.

Представник NVIDIA заявив, що дослідження компанії “повністю відповідає букві та духу закону про авторське право”. Компанія стверджує, що закони про інтелектуальну власність захищають конкретні вирази, “але не факти, ідеї, дані чи інформацію”.

Компанія прирівняла цю практику до права людини “вивчати факти, ідеї, дані або інформацію з іншого джерела і використовувати їх для власного самовираження”.

Представник YouTube не погоджується з такою риторикою. Він вказав на попередній аналогічний випадок, коли OpenAI навчала свій штучний інтелект на матеріалах хостингу. Використання YouTube для навчання ШІ-моделей буде “явним порушенням наших умов”, повідомляють в компанії.

Деякі співробітники NVIDIA висловлювали занепокоєння щодо такої практики, але отримали відповідь від своїх керівників, що вже мають “зелене світло” на найвищому рівні компанії.

Як повідомляється, крім відео з YouTube та Netflix NVIDIA також використовувала бази даних з хостингу кінотрейлерів MovieNet, внутрішніх бібліотек відеоігор та наборів відеоданих Github WebVid (нині не працює) та InternVid-10M.

Як повідомляється, щоб уникнути виявлення з боку YouTube, NVIDIA завантажувала контент за допомогою віртуальних машин із різними IP-адресами. У відповідь на пропозицію працівника використовувати сторонній інструмент для зміни IP-адреси, інший співробітник NVIDIA написав: “Ми працюємо на [Amazon Web Services] і перезапуск [віртуальної машини] дає нову публічну IP-адресу. Так що поки що це не є проблемою”.