OpenAI має трохи понад тиждень на виконання вимог європейського законодавства про захист даних, інакше компанії загрожують величезні штрафи, видалення даних та навіть заборона діяльності. Про це пише MIT Technology Review.

Ці вимоги вона має виконати після низки розслідувань в країнах Євросоюзу та тимчасової заборони діяльності в Італії. Але для OpenAI буде практично неможливо дотриматися правил, оскільки для навчання ШІ-моделей компанія закачувала контент з інтернету.

В розробці ШІ домінує парадигма, що більша кількість навчальних даних – це на краще. Приміром, у моделі OpenAI GPT-2 набір даних складався з 40 гігабайтів тексту. GPT-3, на якій базується ChatGPT, вчилася на 570 гігабайтах. Водночас об’єм даних для GPT-4 лишається невідомим.

Як відомо, останнім часом деякі західні органи захисту даних почали розслідування того, як компанія збирає та обробляє дані, що лежать в основі ChatGPT. На їхню думку, OpenAI могла збирати особисті дані людей та використовувати їх без їхньої згоди.

Раніше OpenAI запустила програму винагороди за виявлення вразливостей у своїх API, зокрема в популярному чат-боті ChatGPT, та пропонує грошову винагороду в розмірі до $20 000.