Нові результати дослідження, проведеного командою з платформи Hugging Face, виявили суттєві проблеми з енергоефективністю генеративних систем штучного інтелекту, що створюють відео з текстових запитів. Про це пише Futurism. Вчені встановили, що збільшення тривалості ролика призводить до непропорційного зростання енергоспоживання: 6-секундний кліп потребує у чотири рази більше електроенергії, ніж 3-секундний.
Автори роботи наголошують, що така залежність свідчить про структурну неефективність сучасних алгоритмів відеогенерації. Для порівняння, створення одного зображення розміром 1024×1024 пікселі еквівалентне 5 секундам роботи мікрохвильової печі, тоді як генерація одного 5-секундного відео відповідає понад годині її безперервної роботи. При збільшенні тривалості роликів витрати зростають ще швидше, що означає значні апаратні та екологічні наслідки.
Дослідники пропонують кілька шляхів зменшення навантаження: використання кешування, повторне застосування вже згенерованих матеріалів та так зване "відсікання" — вилучення неефективних прикладів із навчальних наборів даних. Водночас вчені визнають, що цих заходів може бути недостатньо для суттєвого зниження споживання електроенергії.
За даними інших досліджень, на системи штучного інтелекту вже припадає близько 20% глобального енергоспоживання дата-центрів. Великі технологічні компанії інвестують десятки мільярдів доларів у розширення інфраструктури, що ускладнює досягнення кліматичних цілей. Так, у звіті Google за 2024 рік зазначено, що викиди вуглецю компанії зросли на 13% у порівнянні з попереднім роком, значною мірою через впровадження генеративних ШІ-рішень.
При цьому Google представила відеогенератор Veo 3, користувачі якого створили понад 40 мільйонів роликів лише за 7 тижнів. Екологічний вплив цього продукту компанія не розкриває, однак дослідники припускають, що він може бути досить значним.