У вересні у NotebookLM від Google з’явилася можливість перетворювати документи користувачів на подкаст, де двоє ведучих проговорюють весь матеріал у форматі діалогу. Тепер Meta представляє власну версію такої функції, повідомляє TechCrunch.
Інструмент під назвою NotebookLlama створюватиме транскрипцію з файлу, статті чи блогу у форматі подкасту. Після цього до транскрипції додадуть “більше драматизації” та пауз, а тоді готовий сценарій буде передано до моделей синтезу мовлення.
Для цього Meta використовує власні мовні моделі, зокрема Llama 3.2, Llama 3.1 та модель синтезу мовлення з відкритим кодом Parler.
Поки що готові подкасти від NotebookLlama поступаються тому, що виходило у NotebookLM від Google. Згенеровані голоси звучать як роботи та говорять поверх один одного. Проте дослідники з Meta кажуть, що результат можна буде покращити, використавши потужніші моделі.
Приєднатися до списку очікування нового інструмента можна на офіційному сайті NotebookLlama.
Завантаження коментарів …