DeepSeek розробляє ШІ-моделі, які здатні до самовдосконалення

Congress bans DeepSeek

Євгеній Демківський Автор новин Mezha.Media та гік. Пишу про технології, кіно та ігри. Можливо, про ігри з трохи більшою пристрастю.

7 квітня, 12:12

DeepSeek спільно з китайським Університетом Цінхуа працює над новим підходом навчання моделей штучного інтелекту, який має знизити витрати на цей процес, пише Bloomberg.

Згідно з новим підходом, штучний інтелект буде самостійно закріплювати набуті знання. Цей метод покликаний допомогти моделям краще відповідати на людські уподобання. Метод навчання з підкріпленням довів свою ефективність у прискоренні виконання завдань ШІ в спеціалізованих сферах.

Однак використання цього методу у більш загальних моделях виявилося складним завданням – саме цю проблему команда DeepSeek намагається розв’язати. Стратегія перевершила існуючі методи й моделі в різних тестах, а результат показав кращу продуктивність з меншими обчислювальними ресурсами.

DeepSeek називає ці нові моделі DeepSeek-GRM (generalist reward modeling) та планує випустити їх із відкритим вихідним кодом.

Поділитися:

DeepSeek розробляє ШІ-моделі, які здатні до самовдосконалення

Топ обговорень

Останні новини

Новини партнерів