Ренд Фішкін з компанії SparkToro, яка займається розробкою інструментів для дослідження ринку та аналізу аудиторії, отримав лист від особи, яка стверджувала, що має доступ до масового витоку документації API з відділу пошуку Google. Про це пише 9to5Mac.

У цій документації Google пояснює як працює система пошуку, які компоненти впливають на генерацію результатів та багато іншого. Загалом документація має понад 2500 сторінок та містить 14 014 атрибутів (функцій API), які надходять із внутрішнього “Сховища API вмісту” Google.

Цей витік ймовірно походить з GitHub, де компанія, здається, випадково зробила документацію загальнодоступною на період з 27 березня і по 7 травня. Попри те, що ця інформація показує, які дані та фактори можуть бути використані під час генерації результатів, їх важливість та пріоритетність не розкривається.

Серед подробиць документа, які розкрив Фішкін, є те, що компанія сама вирішує, які сайти можна відображати зверху пошуку для таких тем, як інформація про вибори чи подорожі.

У компанії є своєрідні білі списки, для яких сайти мають позначки на кшталт isCovidLocalAuthority та isElectionAuthority. Зокрема у 2019 році під час початку пандемії Covid-19 компанія також власноруч обирала які сайти з інформацією про коронавірус відображати першими.

Також Фішкін розповів, що документи свідчать про те, що Google обчислює кілька типів показників які можна викликати за допомогою переглядів у Chrome, пов’язаних як з окремими сторінками, так і з доменами.

Це означає, що компанія відстежує, на які сторінки користувачі браузера переходять найбільше та пропонує їх у видачі у вигляді найпопулярніших чи найважливіших сторінок на сайті, хоч раніше й стверджувалося, що жодні дані з Chrome не використовуються.

Витік документації Google показує, що компанія має білі листи сайтів, використовує дані з Chrome для алгоритмів пошуку

Крім того, стало відомо, що компанія використовує рейтинги своєї платформи для перевірки якості EWOK для формування пошуку. Поки незрозуміло, який саме вплив ці рейтинги мають на пошукову видачу, але докази її застосування також знайшли у документації.

Витік документації Google показує, що компанія має білі листи сайтів, використовує дані з Chrome для алгоритмів пошуку

Останнім пунктом, яким поділився Фішкін, є те, що Google також використовує дані про кліки користувачів для того, щоб вирішити яку вагу мають ті чи інші посилання у рейтингу. Отже, якщо певні сторінки на сайтах не мають кліків, вони потрапляють в індекс низької якості, а посилання ігнорується, натомість якщо сторінки мають багато кліків з підтверджених пристроїв, вони мають вищий індекс якості та стають надійними.

Також після того, як SEO-спеціалісти почали ознайомлюватися з документацією, вони стверджують, що вона суперечить публічним заявам Google про те, як працює пошук.

Сама компанія поки жодним чином не прокоментувала ситуацію.