Деякі великі технологічні компанії без дозволу використовували розшифровки відео з YouTube, щоб навчати свої моделі штучного інтелекту. Про це свідчить розслідування Proof News, пише Engadget.
Йдеться про набір даних, який включав розшифровки понад 173 тис. відео з YouTube. Його створила некомерційна компанія EleutherAI. Набір, в якому містилися розшифровки роликів із понад 48 тис. каналів відеохостингу, використовувався зокрема компаніями Apple, NVIDIA та Anthropic.
Набір даних не включає жодного відео чи зображення з YouTube, але містить розшифровки відео від найбільших творців платформи, зокрема Marques Brownlee і MrBeast, а також великих новинних видавництв, таких як The New York Times, BBC і ABC News.
Тим часом у Google заявили, що нещодавні попередження гендиректора YouTube Ніла Мохана про те, що компанії, які використовують дані YouTube для навчання моделей ШІ, порушують умови та правила сервісу, залишаються в силі.