Компанія OpenAI представила свою останню модель штучного інтелекту під кодовою назвою Strawberry та офіційною назвою OpenAI o1, повідомляє TechCrunch. Модель є частиною сімейства, що включає дві версії: o1-preview і o1-mini, причому остання розроблена як менша і більш ефективна, призначена в першу чергу для генерації коду.
Наразі OpenAI o1 доступна для передплатників ChatGPT Plus та Team, а ранній доступ для корпоративних та освітніх користувачів буде відкрито наступного тижня. Однак модель o1 поки що є відносно базовою. На відміну від свого попередника, GPT-4o, їй бракує можливостей веббраузингу чи аналізу файлів, і хоча вона має функції аналізу зображень, вони тимчасово вимкнені для подальшого тестування. Крім того, ця модель обмежена за швидкістю, дозволяючи лише 30 повідомлень на тиждень для o1-preview і 50 для o1-mini.
Недоліком нової моделі також є її вартість. o1-preview має високу ціну в API – $15 за 1 мільйон вхідних токенів і $60 за 1 мільйон вихідних токенів, що значно дорожче, ніж GPT-4o. Попри ці проблеми, OpenAI планує зробити o1-mini доступним для всіх користувачів безплатного ChatGPT, хоча конкретної дати релізу ще не оголошено.
Що відрізняє o1 від інших моделей генеративного ШІ, так це його здатність “перевіряти себе”, витрачаючи додатковий час на розгляд різних аспектів запиту перед тим, як відповісти. Ця здатність дозволяє моделі “думати” більш ефективно, що робить її придатною для складних завдань, які вимагають вищого рівня синтезу, таких як аналіз електронних листів на предмет привілейованої інформації або мозковий штурм маркетингових стратегій.
За даними OpenAI, o1 використовує навчання з підкріпленням, заохочуючи модель “думати”, перш ніж відповісти, імітуючи ланцюжок думок. Це підкріплюється системою заохочень і покарань, що допомагає моделі планувати наперед і виконувати кілька дій для отримання відповіді. Таким чином, в теорії, чим довше OpenAI o1 обробляє запит, тим кращою буде відповідь.
Новий алгоритм оптимізації OpenAI та спеціально підібраний навчальний набір даних, який включає наукову літературу та дані міркувань, ще більше розширюють можливості o1. Під час випробувань o1 перевершив GPT-4o в різних завданнях, включаючи вирішення 83% завдань на відбірковому іспиті Міжнародної математичної олімпіади (у порівнянні з 13% у GPT-4o) і потрапляння в 89-й процентиль на змаганнях з програмування Codeforces.
Хоча o1 перевершує свої можливості в таких сферах, як аналіз даних, наука та кодування, модель має певні обмеження. Наприклад, вона може бути повільнішою за інші моделі, відповідаючи на певні запити понад 10 секунд. Крім того, перші тестувальники повідомляли, що o1 може “галюцинувати” (генерувати неправильні, але впевнені відповіді) частіше, ніж GPT-4o, і менш схильна визнавати, що не знає відповіді.
Попри ці проблеми, OpenAI вважає, що o1 – це крок вперед у міркуваннях ШІ. Дослідники Google DeepMind продемонстрували аналогічні покращення точності моделі, даючи своїм моделям більше часу на обчислення відповідей, що підкреслює жорстку конкуренцію в галузі ШІ. Цікаво, що OpenAI вирішив не показувати необроблені “ланцюжки думок” o1 в ChatGPT, посилаючись на проблеми конкуренції, і замість цього вирішив показувати “згенеровані моделлю резюме” цих ланцюжків.
Остаточним випробуванням для OpenAI стане забезпечення широкої доступності o1 за більш прийнятною ціною. Компанія планує продовжувати вдосконалювати модель, експериментуючи з версіями, які могли б міркувати протягом тривалих періодів — від годин до днів або навіть тижнів — для подальшого поліпшення її здібностей до міркувань.
Завантаження коментарів …