Stability.ai робить загальнодоступною власну ШІ-розробку для створення зображень із тексту. Особливість Stable Diffusion у тому, що модель потребує менше, ніж 10 Гб відеопам’яті і може працювати на споживчих графічних процесорах, за кілька секунд створюючи з тексту картинку 512х512 пікселів. 

«Це дозволить як дослідникам, так і громадськості користуватись моделлю за різних умов, демократизуючи створення зображень. Ми з нетерпінням чекаємо на відкриту екосистему, яка виникне довкола цієї та інших моделей, щоб по-справжньому досліджувати межі прихованого простору», – говорять розробники.  

Модель створили у співпраці з Dall-E 2 від Open AI, Imagen від Google Brain та іншими. Її перевіряли понад 10 000 бета-тестерів, генеруючи 1.7 мільйона зображень на день. Розробники попереджають, що оскільки модель навчали на великій кількості пар зображення-текст з широкої інтернет-вибірки, вона може відтворювати деякі упередження. Компанія закликає всіх долучитися до обговорення цих упереджень. 

«Ми сподіваємося, що всі будуть використовувати це етично, морально й законно, та зроблять свій внесок у спільноту і дискурс довкола неї», – зауважують розробники.

Долучитися до спільноти Stable Diffusion на Discord можна за посиланням. А тут – дізнатися про модель більше на Hugging Face.