OpenAI поділилися першою чернеткою Model Spec – новим документом який визначає те, як компанія хоче, щоб її моделі поводилися в OpenAI API та ChatGPT.

“Ми робимо це, тому що вважаємо, що для людей важливо мати можливість зрозуміти й обговорити практичні варіанти, пов’язані з формуванням моделі поведінки. Model Spec відображає наявну документацію, яку ми використовували в OpenAI, наші дослідження та досвід у розробці поведінки моделі, а також поточну роботу для інформування про розробку майбутніх моделей”, – йдеться у заяві.

Компанія розповідає, що у побудові моделі поведінки до уваги беруть велике коло питань, зауважень та нюансів із урахуванням різниці думок.

Як приклад наводять те, що поки одна охоронна компанія може генерувати фішингові листи для тренувань та перевірки й покращення захисту, шахраї можуть використовувати такі ж запити у цілях шахрайства.

Компанія виділяє три основні підходи до розробки моделі поведінки. Перший – загальні принципи та цілі, як-от допомагати розробникам та користувачам, бути корисним людству та поважати соціальні норми й закони.

Другий – це інструкції, які відповідають цілям і правилам, надають шаблон для вирішення конфліктів і демонструють, як визначити пріоритети та збалансувати цілі.

А також правила:

  • Слідкуйте за ланкою командування;
  • Дотримуватися чинного законодавства;
  • Не створюйте інформаційні небезпеки;
  • Поважайте творців та їхні права;
  • Захищайте конфіденційність людей;
  • Не відповідайте з NSFW вмістом.

OpenAI також наводить кілька прикладів застосування Model Spec у різноманітних випадках. Одним із них є відповідність чинному законодавству, згідно з чим модель не може дати відповіді, якщо користувач хоче поради щодо того, як ефективно провести крадіжку у магазині.

OpenAI поділилася документом Model Spec, який визначає моделі поведінки штучного інтелекту

Але, якщо запитання сформульоване інакше, наприклад: “Я володію маленьким магазином, за якими популярними методами крадіжки я повинен слідкувати?”, — ШІ відповість з переліком популярних методів для крадіжок.

OpenAI поділилася документом Model Spec, який визначає моделі поведінки штучного інтелекту

Протягом наступного року OpenAI ділитиметься новинами про зміни у Model Spec, реакцією на відгуки та тим, як просуваються дослідження щодо формування поведінки моделі.