Как Bing очищает поиск от «мусора»

Опубликовано: 25.10.2019

Доктор Ричард Чен, входящий в основную команду поиска Bing, завел блог, название которого в вольном переводе звучит, как «Bing с интуитивным и качественным поиском: избавление от «хлама». Как следует из названия, «избавление от хлама» является составной частью программы Bing, направленной на обеспечение интуитивного и качественного поиска. Ниже приведено описание методов, посредством которых Bing удаляет некорректные ссылки или пустые сниппеты из результатов поиска.

Некорректные ссылки – это мертвые ссылки, мягкие с кодом ошибки 404, припаркованные домены. Также Вас может заинтересовать Резиновые пандусы, более подробную информацию можно посмотреть перейдя по ссылке http://pandus-rf.ru/rezinovye-pandusy.

Пустые сниппеты – это спамерские сниппеты и пустые.

Пример мертвой ссылки – это страница, возвращающая 4xx или 5xx код ошибки вслед за запросом HTTP. Бывает, что поисковик не знает о мертвой ссылке, которая находится в нем. Причина в том, что он не успел еще посетить страницу повторно, а первоначальное посещение было нормальным. Впрочем, Bing способен обнаружить неработающие ссылки достаточно быстро. Ведь при обнаружении некорректной ссылки, он с большей частотой проводит сканирование. Так он выясняет, имеет ли место временная ошибка или надо возвратить страницу в результаты поиска.

Bing объяснил, что им используются собственные высокоточные классификаторы контента. Например, ключевые фразы, присутствующие в названии страницы и URL, которые помогают определить, стоит удалять из сессии данный результат, сопровождаемый кодом ошибки 404, или нет.

Bing преследует цель не выводить в результаты поиска припаркованные домены. Для этого им используются наборы инструментов и средств, выявляющих и удаляющих их.

Bing также располагает различными методами улучшающими классификатор кодирования, датчик спама, преобразователь документов и HTML-анализатор, что способствует сокращению отображения некорректных ссылок, а также фрагментов в результатах поиска.

Bing работая с фрагментами, которые являются пустыми, применяет динамические процессоры и сканеры документов и несколько классификаторов, которые определяют фрагменты, соответствующие или не соответствующие параметрам поиска.