Google додасть у Google Translate підтримку ще 110 мов, від кантонської до кекчі. Це стане найбільшим оновленням перекладача, яке стало можливим завдяки великій мовній моделі PaLM 2.

Деякі з нових представлених мов використовуються понад 100 мільйонами людей, інші належать до невеликих громад корінного населення.

Кілька нових мов практично не мають носіїв, проте вони активно відроджуються. Приблизно чверть з усіх нових мов, які додадуть у Google Translate, походять з Африки, зокрема мови Фон, Конго, Луо, Га, Сваті, Венда та Волоф.

Серед цих 110 мов зокрема є й кримськотатарська – тюркська мова, рідна мова кримських татар. Сьогодні кримськотатарська належить до мов, що потребує додаткового захисту за класифікацією UNESCO. Крім того, у січні 2023 року в Україні було створено Національну комісію з питань кримськотатарської мови, що має її захищати.

Ще одним великим оновленням є кантонська мова, яку вже давно просили додати у Google Translate. Компанія розповідає, що проблема з доданням саме цієї мови полягала у тому, що вона сильно переплітається з мандаринською мовою у письмі, тож виникали труднощі з тим, щоб знайти дані та натренувати модель.