Китайська DeepSeek знову використала чужу модель для навчання своєї, цього разу Google Gemini

deepseek

Євгеній Демківський Автор новин Mezha.Media та гік. Пишу про технології, кіно та ігри. Можливо, про ігри з трохи більшою пристрастю.

4 червня, 10:25

Китайська компанія DeepSeek, яка нещодавно представила оновлену версію ШІ-моделі R1, могла частково тренувати її на Gemini від Google. Про це повідомив розробник Сем Пейч, який дослідив оновлену R1-0528.

If you're wondering why new deepseek r1 sounds a bit different, I think they probably switched from training on synthetic openai to synthetic gemini outputs. pic.twitter.com/Oex9roapNv
— Sam Paech (@sam_paech) May 29, 2025

За його словами, модель DeepSeek демонструє лінгвістичні схожості з Google Gemini 2.5 Pro. Як пише TechCrunch, інший дослідник під ніком SpeechMap звернув увагу на подібність "трас мислення" — проміжних міркувань моделі під час розв’язання задач.

Це не перше припущення про використання сторонніх моделей у тренуванні DeepSeek. Раніше виявили, що версія V3 іноді представляється як ChatGPT, що може свідчити про тренування на відповідях OpenAI. У січні Financial Times повідомили, що OpenAI знайшла докази використання техніки дистиляції для витягання даних із більш потужних моделей, ймовірно, через акаунти, пов’язані з DeepSeek.

Попри те, що дистиляція — поширений підхід, OpenAI забороняє використовувати свої моделі для створення конкурентних рішень. Через це великі розробники ШІ, зокрема OpenAI, Google та Anthropic, посилили заходи безпеки, зокрема ввели верифікацію клієнтів і почали приховувати проміжні дані моделей.

Google наразі не надала офіційних коментарів щодо ситуації та не повідомила, чи розпочала розслідування щодо звинувачень на адресу DeepSeek.

Поділитися:

Китайська DeepSeek знову використала чужу модель для навчання своєї, цього разу Google Gemini

Топ обговорень

Останні новини

Новини партнерів