Алгоритм поисковой системы или поисковой алгоритм - набор предписаний, определяющих четкий порядок действий поисковой системы, направленных на составление максимально релевантной выдачи по пользовательскому запросу. Входными данными для работы алгоритма является запрос пользователя, выходными – поисковая выдача.

Факторы, влияющие на уровень релевантности

Практически все системы поиска имеют собственные поисковые алгоритмы, содержание которых составляет коммерческую тайну. Узнать точно насколько каждый из факторов влияет на уровень релевантности ресурса невозможно, однако возможно определить основные значимые моменты:

  • Востребованность и популярность контента ресурса, соответствие ключевых слов запроса информации на страницах сайта.
  • Срок функционирования ресурса.
  • Имя домена, ресурса, доменные зона и уровень.
  • Общий объем контента (включая все страницы) и число страниц.
  • Использование ключевых слов – их количество, распределение по ресурсу и его страницам, плотность.
  • Авторитетность ресурса вообще и его страниц в частности.
  • Дизайн ресурса, общность стиля каждой из страниц.
  • Число пользовательских запросов из слов, составляющих семантическое ядро ресурса, введенных за установленный временной период.
  • Индекс цитирования.
  • Актуализация контента, периодичность его обновления, а так же промежуток времени от даты последнего изменения.
  • Используемые приемы форматирования ключевых слов, заголовков.
  • Наличие и правильная подача графического контента, фреймов, мультимедиа и flash информации.
  • Положение ключевых слов относительно начала текста.
  • Применение метатегов.
  • Серые приемы уникализации текста: ключевые слава, написанные с использованием пробелов (в р а з р я д к у), специальные «описки»,ошибки и проч.
  • Наличие и использование файла robots.txt.
  • Параметр вложенности (глубины) сайта, число уровней (страниц, на которые можно перейти, не попадая дважды на одну и ту же).
  • Местоположение, язык ресурса.
  • Присутствие в программном коде комментариев.
  • Количество и качество ссылок (внутренних и внешних).

Помимо данных факторов существует множество дополнительных параметров, влияющих на расчет уровня релевантности контента.

Группы поисковых алгоритмов

Принципы работы некоторых поисковых алгоритмов кардинально отличаются. Учитывая это, их разгруппировали на два вида:

Группа алгоритмов прямого действия

Данная группа алгоритмов совершает поиск по индексной базе прямым методом, т.е. просматривает по порядку все имеющиеся документы. Результатом просмотра является предельно релевантная выдача. Естественно, что такой тщательный поиск занимает много времени, что является значительными минусом алгоритмов данной группы. При больших объемах индексов за счет длительного ожидания эффективность поиска сводится на нет, поэтому масштабные поисковые системы такие алгоритмы поиска не применяют.

Группа алгоритмов обратного индекса

Алгоритмы этой группы используют для осуществления поиска преобразованную базу индексов – обратный индекс. Все записи в ней представлены текстовыми файлами, содержащими список слов из контента сайтов и координаты этих слов. Скорость поиска при использовании таких файлов разительно возрастает, однако снижается релевантность. Тем не менее, ведущие системы поиска применяют исключительно алгоритмы обратного индекса как наиболее быстрые.

Апдейт алгоритмов поисковой системы

Подробная информация: Апдейт

Поисковые системы постоянно изменяют алгоритмы, добавляя новые факторы, влияющие на ранжирование и исключая старые, уже незначимые. Такие изменения (апдейты) напрямую воздействуют на положение большинства сайтов в итоговой поисковой выдаче.

После проведения апдейта возникает необходимость оценки корректности работы алгоритмов. Этим занимаются асессоры – приглашенные пользователи-тестеры, которые анализируют соответствие выдачи запросам с точки зрения обычных людей.  Результаты их труда рассматриваются, и при необходимости изменений производится новый апдейт поискового алгоритма.

Алгоритмы поиска систем Google и Яндекс

Google и Яндекс являются самыми известными поисковиками среди пользователей рунета. Их алгоритмы поиска применяются не только самими сервисами, но и другими поисковыми системами. 

На вооружении Google стоит алгоритм Panda, который имеет множество версий.

Яндекс имеет поисковые алгоритмы собственной разработки, выбирая им для названия имена российских городов. Так существуют алгоритмы Арзамас, Конаково, Краснодар, Магадан, Находка, Обнинск, Снежинск.

См. дополнительно: