Китайська компанія DeepSeek, яка нещодавно представила оновлену версію ШІ-моделі R1, могла частково тренувати її на Gemini від Google. Про це повідомив розробник Сем Пейч, який дослідив оновлену R1-0528.
За його словами, модель DeepSeek демонструє лінгвістичні схожості з Google Gemini 2.5 Pro. Як пише TechCrunch, інший дослідник під ніком SpeechMap звернув увагу на подібність "трас мислення" — проміжних міркувань моделі під час розв’язання задач.
Це не перше припущення про використання сторонніх моделей у тренуванні DeepSeek. Раніше виявили, що версія V3 іноді представляється як ChatGPT, що може свідчити про тренування на відповідях OpenAI. У січні Financial Times повідомили, що OpenAI знайшла докази використання техніки дистиляції для витягання даних із більш потужних моделей, ймовірно, через акаунти, пов’язані з DeepSeek.
Попри те, що дистиляція — поширений підхід, OpenAI забороняє використовувати свої моделі для створення конкурентних рішень. Через це великі розробники ШІ, зокрема OpenAI, Google та Anthropic, посилили заходи безпеки, зокрема ввели верифікацію клієнтів і почали приховувати проміжні дані моделей.
Google наразі не надала офіційних коментарів щодо ситуації та не повідомила, чи розпочала розслідування щодо звинувачень на адресу DeepSeek.