Knowledge-Based Trust от Гугл

KBTГугл опубликовал доклад об оценке доверия к сайту на основе знаний (Knowledge-Based Trust). Специально для нашего блога был выполнен перевод этого доклада (Knowledge-Based Trust русский перевод). Пока работы над этой оценкой больше похожи на весьма предварительный эксперимент. Однако, по всей видимости, в случае успешной настройки фактора доверия, основанного на знании, он будет применяться как полноценный фактор ранжирования. Поэтому давайте заранее посмотрим, над чем же сейчас работает Гугл.

Что за зверь Knowledge-Based Trust?

Инженеры в Гугле предпринимают попытки определить доверие к сайту на основе информации, которую он содержит. Чем больше корректных фактов имеется на сайте, тем больше доверия к этому сайту или отдельному документу на сайте.

Гугл уже давно собирает факты в свое «хранилище знаний» (Knowledge Vault). Они хранятся в виде триад субъект-предикат-объект, например, «Барак Обама, гражданство, США». Факты собираются с различных сайтов в сети при помощи разных алгоритмов (экстракторов).

В докладе показано, как математическими методами можно определить максимально точно, какие триады являются истинными, а какие ложными. Причем в процессе вычислений отдельно учитывается показатель доверия к каждому конкретному экстрактору.

Идя дальше, можно определить, какой процент фактов на том или ином сайте является корректным. При этом, судя по докладу, инженеры будут стараться избегать тривиальных триад, когда для определенных предикатов существует малое разнообразие объектов. По всей видимости, суть в том, чтобы не учитывать какую-то банальную информацию, например, что день состоит из 24 часов и тому подобное.

Далее, если добавить фактор доверия в алгоритм ранжирования, то можно повысить вес доверенных сайтов и документов, чтобы они заняли более высокие позиции в выдаче. Конечно, речь идет не о всех запросах, о чем и указывает Гугл в докладе. Представьте коммерческую выдачу по запросу «купить телевизор Samsung». О каком ранжировании на основе доверия может идти речь? Но для информационных запросов это может быть хорошей идеей.

knowledge based trustСравнивая доверие, основанное на знаниях, с пейдж ранком, инженеры Гугла отмечают, что в основном эти два сигнала взаимно перпендикулярны друг другу. То есть страницы с высоким пейдж ранком одновременно имеют высокий уровень доверия и наоборот.

Отмечаются также исключения. Например, бывают страницы с высоким уровнем доверия, но низким значением пейдж ранка. С другой стороны, попадаются страницы с высоким пейдж ранком, но низким уровнем доверия. Среди них страницы на сайтах светской хроники (сплетни, слухи), а также форумы, что логично, так как на них очень часто выкладывается ложная информация.

Выводы

На мой взгляд, Гугл делает большую ставку на разработку данного фактора доверия. Судя по разделу 5.4.2 доклада еще предстоит большая работа, чтобы довести все это до ума. Но, похоже, принципиальное решение принято, и если в процессе разработки инженеры не столкнутся с непреодолимыми проблемами, данный фактор рано или поздно будет внедрен в поисковую выдачу.

Предположительно это улучшит ранжирование небольших информационных сайтов, публикующих корректную проверенную информацию. Пострадать могут сайты со слухами и сплетнями, форумы и им подобные ресурсы. Вероятно, хуже будут ранжироваться статьи с какими-то шокирующими новостями, которые опровергают известные факты. Но, наверное, процентов 90 таких новостей оказываются уткой, так что, возможно, это и к лучшему.

Конечно, доверие, основанное на знаниях, не заменит пейдж ранк (ссылочный фактор), но может внести существенные коррективы в поисковое ранжирование.

И последнее, отвечая на вопрос Игоря Бакалова, представитель Гугла Андрей Липатцев подтверждает, что:

1. Фактор доверия пока находится в стадии исследования и не применяется в поиске и, вероятно, будет внедрен очень нескоро

2. Фактор может применяться далеко не для всех типов запросов

3. Фактор не заменит собой пейдж ранк и не приведет к отказу от него

  

Один отзыв

  1. #1 Леонид → 22 Март 2015 в 12:25

    Интересно только когда это заработает в рунете.


Статьи навсегда Форум Биржа и магазин контента Биржа сайтов Автопродвижение сайта

О проекте   |   Оптимизаторам   |   Вебмастерам   |   Блог   |   Правила/Частые вопросы   |   Техподдержка