Цей рік стане переломним для користувачів інтернету, оскільки вони отримають вільний доступ до останніх розробок в галузі штучного інтелекту. Поштовх який відбувся із запуском ChatGPT продовжиться із додаванням чат-ботів в пошук Bing та Google, проте вже зрозуміло, що це стане жорстким стрес-тестом для компаній та технології. Попри фільтрацію відповідей, які може надавати штучний інтелект, розробникам буде важко втримати цього «джина» у пляшці. Наочним прикладом цього є «джелбрейк» ChatGPT, який активно обговорюється на Reddit.

Користувачі Reddit обходять фільтри ChatGPT за допомогою рольової гри із чат-ботом

Річ у тім, що попри автоматичну та людську модерацію чат-бота, фільтри часто не враховують той факт, що з ним можна спробувати пограти у рольову гру, в якій ChatGPT можна змусити вжитися в роль іншого штучного інтелекту без жодних обмежень. Цей метод отримав назву DAN, скорочено від «Do Anything Now» (з англійської «Тепер роби що завгодно»), і зараз працює з перемінним успіхом, оскільки після обговорення на Reddit компанія Open AI почала звертати увагу на цю проблему. Проте користувачі продовжують знаходити нові можливості обдурити фільтри ChatGPT та змусити чат-бот відповідати від імені іншого штучного інтелекту. Зараз на Reddit вже можна знайти сьому версію DAN або SDAM (Simple DAN), з нею чат-бота можна навчити відповідати від імені ШІ SAM, який завжди бреше.

Користувачі Reddit обходять фільтри ChatGPT за допомогою рольової гри із чат-ботом

Такі маніпуляції дозволяють користувачам отримувати від ChatGPT відповіді з ненормативною лексикою, підтримкою насильницьких дій та викривленням фактів. Загалом всього того, що будь-яка компанія прагне уникнути у своїх продуктах з функціями штучного інтелекту. Проте якщо для Open AI, по суті лабораторії для експериментів з ШІ, такі випадки не приносять прямої шкоди, то Microsoft та Google, акції яких торгуються на біржі, можуть втратити багато навіть через такі поодинокі випадки. А судячи з усього, користувачі будуть знаходити способи отримати від чат-ботів те, що вони забажають, навіть якщо це той тип поведінки, якому штучний інтелект краще не навчати.