Поштовий сервіс Gmail отримав оновлення спам-фільтрів, яке в Google називають «одним із найбільших оновлень системи захисту за минулі роки». Про це пише Ars Technica.

Йдеться про нову систему класифікації текстів RETVec (Resilient & Efficient Text Vectorizer), яку інтегрували в Gmail. За твердженнями Google, вона здатна розпізнавати «ворожі текстові маніпуляції» – це електронні листи зі спеціальними символами та іншими елементами, які фільтри важко розрізняли.

Gmail

Такі листи часто містять так звані «гомогліфами». Так називають графічно схожі один на одного знаки, які насправді мають різне значення. В Google запевняють, що RETVec навчений виявляти відповідні повідомлення.

Модель навчали з використанням нового кодувальника, який може ефективно кодувати всі символи та слова у форматі UTF-8. За інформацією компанії, RETVec працює на понад 100 мовах.

Алгоритм побудовано на базі ШІ-фреймворку TensorFlow. Google заявляє, що тестувала RETVec «протягом минулого року» та вже розгорнула систему в акаунтах Gmail.