OpenAI створила інструмент, щоб транскрибувати відео з YouTube та зібрати дані для навчання GPT-4

OpenAI

Євгенія Губіна Редакторка новин оборонної тематики. Загальний досвід роботи в журналістиці – понад 18 років. Захоплююся технологіями, космосом та обожнюю собак.

8 квітня 2024, 11:04

Для цього дослідники OpenAI створили інструмент розпізнавання мови під назвою Whisper. Він міг транскрибувати аудіо з відео на YouTube, отримуючи розмовний текст.

До таких дій OpenAI вдалася після того, як наприкінці 2021 року компанія зіткнулася з проблемою постачання навчальних даних. Вона вичерпала доступні матеріали, але однаково потребувала великого масиву даних.

За словами обізнаних джерел, деякі співробітники OpenAI обговорювали, як розшифровка відео та використання отриманих текстів може суперечити правилам YouTube.

Але зрештою команда OpenAI розшифрувала понад 1 млн годин відео з YouTube та завантажила отримані тексти в GPT-4. Примітно, що президент OpenAI Грег Брокман особисто допомагав збирати відео, розповідають інформовані джерела.

Нагадаємо, що недавно CEO YouTube Ніл Мохан в інтерв’ю Bloomberg заявив, що використання відео з платформи для навчання ШІ-моделі Sora від OpenAI буде порушенням умов надання послуг YouTube.

Як відомо, створення інноваційних систем залежить від наявності достатньої кількості даних, щоб навчити технології миттєво створювати текст, зображення, звуки та відео, які нагадують те, що створює людина.

Поділитися:

OpenAI створила інструмент, щоб транскрибувати відео з YouTube та зібрати дані для навчання GPT-4

Топ обговорень

Останні новини

Новини партнерів