ElevenLabs випустила мобільний застосунок для генерації голосу
Компанія ElevenLabs, яка розробляє голосовий штучний інтелект, представила окремий мобільний застосунок для iOS та Android, що дозволяє створювати голосові кліпи з тексту. Раніше для створення таких кліпів треба було використовувати лише вебверсією сервісу.
Усе, що потрібно для роботи — ввести або вставити текст, обрати голос для озвучування й отримати готовий аудіокліп. Безплатний план передбачає приблизно 10 хвилин генерації голосу. Є різні моделі синтезу, що дозволяють обирати потрібний баланс якості. Застосунок також надає доступ до останньої версії моделі v3 alpha, яка підтримує керування виразами голосу за допомогою тегів.
Джек МакДермотт, керівник напряму мобільного розвитку ElevenLabs, розповів TechCrunch, що багато користувачів уже користувалися мобільною версією сайту для генерації голосових кліпів, які потім використовували у відео для соцмереж, наприклад у CapCut або Instagram. Побачивши цей попит, компанія створила окремий застосунок для мобільних пристроїв, щоб надати швидший і зручніший спосіб роботи.
"За останній рік ми побачили справжній вибух творчості в нашій спільноті — творці контенту, маркетологи, педагоги, диктори й фахівці використовують ElevenLabs, щоб втілювати свої проєкти в життя. Багато хто користувався ElevenLabs у мобільному браузері й просив швидший, зручніший та потужніший застосунок, створений спеціально для мобільних пристроїв". — пояснив МакДермотт
Нове рішення дозволяє ElevenLabs конкурувати з іншими подібними сервісами для генерації й клонування голосів, такими як Speechify або Captions.
До речі, це вже другий застосунок для користувачів від ElevenLabs — раніше компанія представила застосунок Reader для прослуховування текстових файлів на ходу.
Надалі ElevenLabs планує розвивати застосунок і розширювати його можливості. Серед майбутніх оновлень — розпізнавання мовлення (speech-to-text), розмовний ШІ-асистент та багато іншого.
Нагадаємо, у лютому компанія ElevenLabs запустила Scribe — модель для перетворення голосу в текст. Вона підтримує понад 99 мов. До речі, саме ШІ-сервіс ElevenLabs переклав інтерв'ю Зеленського Лексу Фрідману.