Команда OpenAI транскрибувала понад 1 млн годин відео з YouTube, щоб використати отримані дані для навчання моделі GPT-4. Про це повідомляє The New York Times.

Для цього дослідники OpenAI створили інструмент розпізнавання мови під назвою Whisper. Він міг транскрибувати аудіо з відео на YouTube, отримуючи розмовний текст.

До таких дій OpenAI вдалася після того, як наприкінці 2021 року компанія зіткнулася з проблемою постачання навчальних даних. Вона вичерпала доступні матеріали, але однаково потребувала великого масиву даних.

За словами обізнаних джерел, деякі співробітники OpenAI обговорювали, як розшифровка відео та використання отриманих текстів може суперечити правилам YouTube.

Але зрештою команда OpenAI розшифрувала понад 1 млн годин відео з YouTube та завантажила отримані тексти в GPT-4. Примітно, що президент OpenAI Грег Брокман особисто допомагав збирати відео, розповідають інформовані джерела.

Нагадаємо, що недавно CEO YouTube Ніл Мохан в інтерв’ю Bloomberg заявив, що використання відео з платформи для навчання ШІ-моделі Sora від OpenAI буде порушенням умов надання послуг YouTube.

Як відомо, створення інноваційних систем залежить від наявності достатньої кількості даних, щоб навчити технології миттєво створювати текст, зображення, звуки та відео, які нагадують те, що створює людина.