Нове дослідження показало, що використання найсучасніших інструментів штучного інтелекту може уповільнювати досвідчених програмістів під час роботи у знайомих їм кодових базах, що суперечить поширеним уявленням про ефективність ШІ, повідомляє Reuters.
Некомерційна організація METR провела дослідження, у межах якого досвідчені розробники open-source використовували Cursor, популярного ШІ-асистента з програмування, для виконання завдань у проєктах, з якими вони були добре обізнані. Перед початком учасники очікували, що ШІ зменшить час виконання завдань на 24%. Після завершення роботи вони все ще були впевнені у користі ШІ, оцінюючи скорочення часу на 20%.
Проте реальні результати виявились протилежними: використання ШІ збільшило час виконання завдань на 19%.
Співавтор дослідження Нейт Раш зізнався, що був шокований результатами, адже очікував "прискорення у 2 рази, що здавалося очевидним".
Ці висновки кидають виклик поширеній думці, що ШІ завжди підвищує продуктивність програмістів – саме ця ідея лежить в основі багатомільярдних інвестицій у продукти ШІ для розробки програмного забезпечення. Також ШІ часто розглядають як потенційну заміну молодших позицій у програмуванні; CEO Anthropic Даріо Амодей нещодавно заявив, що ШІ може ліквідувати половину посад офісних працівників та збільшить безробіття на 10-20% протягом найближчих 5 років.
Раніше дослідження показували суттєві переваги від використання ШІ. Наприклад, одне виявило прискорення роботи програмістів на 56%, інше – збільшення кількості виконаних завдань на 26% за той самий час. Проте дослідження METR свідчить, що ці дані не можна узагальнювати на всі сценарії.
Автори зазначили, що для досвідчених розробників, які добре знають особливості великих open-source проєктів, поради ШІ часто вимагали витрат часу на перевірку та виправлення.
Дослідники наголосили, що їхні висновки не обов’язково стосуються молодших спеціалістів або інженерів, які працюють у незнайомих кодових базах – там ШІ може бути значно кориснішим.
Цікаво, що попри уповільнення, більшість учасників досі використовують Cursor. Автори вважають, що це пов’язано з тим, що ШІ робить процес розробки приємнішим та менш стресовим, навіть якщо не пришвидшує роботу.