Під час конференції Google I/O генеральний директор компанії Сундар Пічаї анонсував значне оновлення чат-бота Bard, який працює на основі великої мовної моделі. Нововведення включають підтримку японської та корейської мов, спрощений експорт тексту до Google Docs та Gmail, візуальний пошук та темну тему.

Важливо, що Google також скасовує список очікування для Bard, роблячи його доступним англійською мовою у 180 країнах, проте при заході з України доступу до чат-бота поки немає. Можливо в Google ще не встигли відкрити його для всіх користувачів, але варто зазначити, що компанія не опублікувала список країн, в яких буде доступний Bard.

Серед майбутніх функцій чат-бота, які Google тільки планується реалізувати, – генерація зображень зі штучним інтелектом за допомогою Adobe та інтеграція зі сторонніми вебсервісами, такими як Instacart і OpenTable.

Google підкреслює, що Bard все ще залишається експериментальним проєктом і не має на меті замінити його пошукову систему. Пропри це, Bard поки не викликав той самий рівень інтересу, як його конкурент – ChatGPT від OpenAI та його похідна – чат-бот Bing від Microsoft. Google прагне розв’язати цю проблему шляхом інтеграції численних нових функцій і модернізації Bard для використання нової мовної моделі PaLM 2, яка, як очікується, покращить його роботу і загальну зручність використання.

Google стверджує, що вдосконалений Bard чудово справляється з написанням коду, включаючи дебагінг та пояснення коду більш ніж 20 мовами програмування. Тому деякі з удосконалень зосереджені на цій функціональності, наприклад, новий темний режим, вдосконалені цитати коду (які надаватимуть джерела та пояснюватимуть фрагменти) і нова кнопка експорту. Остання може переносити код на платформу Colab від Google, а тепер вона також буде сумісна з іншою браузерною IDE, Replit (спочатку для запитів на Python).

Для ширшого використання Google додає в Bard більше візуальних можливостей, що дозволяє йому аналізувати зображення, включати зображення в результати запитів і генерувати візуальні ефекти за допомогою штучного інтелекту. Остання функція, яка, як очікується, буде запущена в найближчі місяці, працюватиме на базі програмного забезпечення Firefly від Adobe.

Візуальні результати в Bard будуть схожі на результати деяких запитів у Google. Наприклад, якщо користувач запитує: «Які пам’ятки в Новому Орлеані є обов’язковими для відвідування?». Bard згенерує список визначних місць, таких як Французький квартал і зоопарк Одюбона, супроводжуваний відповідними зображеннями.

Цікавою функцією є здатність системи генерувати відповіді на основі зображення. Ця функція, що працює на базі Google Lens, ідентифікує об’єкти на фотографіях. Наприклад, якщо користувач завантажує фотографію своїх собак і просить додати до неї кумедний підпис, Google Lens визначає породу собак, що дозволяє Bard згенерувати підпис, пов’язаний з їхніми характеристиками.

Google також планує інтегрувати в Bard генератор зображень Firefly від Adobe зі штучним інтелектом. Adobe просуває його з фокусом на етичне використання своїх навчальних даних, що є предметом суперечок і призводить до судових позовів проти інших ШІ-інструментів для створення зображень, таких як Stable Diffusion. Це перша з багатьох сторонніх інтеграцій для Bard, причому компанія обіцяє пряме підключення до додатків «від Google та інших дивовижних сервісів».

Хоча ці вдосконалення є суттєвими, Google, по суті, повторює функції, які вже пропонують його конкуренти. У березні Microsoft інтегрувала в Bing можливість генерації зображень на основі DALL-E від OpenAI. Окрім того, остання також на початку року анонсувала плагіни для ChatGPT, зокрема доповнення, як дозволяє чат-боту отримувати актуальну інформацію з інтернету.

Попри ці вдосконалення, кінцеве призначення Bard залишається не до кінця зрозумілим. Хоча Google стверджує, що чат-бот не призначений для заміни пошукової системи, це не заважає користувачам використовувати його як заміну інтернет-пошуку. Можливо, Bard стане полігоном для випробувань нових розробок Google у сфері генеративного штучного інтелекту. Проте це також може бути просто паралельний сервіс, адже Google часто не фокусується на якомусь одному продукті. Згадати тільки, скільки месенджерів було у компанії, і вона досі пропонує одразу декілька застосунків для відеодзвінків.