Степень совпадения ожиданий пользователя при вводе поискового запроса и результатов, выданных программой, называется релевантностью. Эффективность поисковой системы определяется этим параметром. Алгоритм, которому следует робот при обработке запроса, ищет соответствующие требованиям слова на различных ресурсах. Релевантность какой-либо страницы сайта определяется числом фраз, совпадающих с использованными в поисковом запросе предложениями.
Различные поисковые системы имеют разные пороги количества слов-ключей при определении релевантности. Для того чтобы страница была признана соответствующей запросу, уровень совпадающих слов должен быть больше пяти процентов. Если доля востребованных слов на сайте меньше пятипроцентного барьера, то такой ресурс признается недостаточно релевантным и просто игнорируется. Однако в том случае, когда площадка содержит намного большее количество искомых фраз, чем нужно для определения соответствия, то ее блокирует спам-фильтр. Поисковые системы открывают пользователям путь во Всемирную сеть. Развитие Интернета отдало главную роль этим программам.
После создания система поиска информации работала отлично до тех пор, пока не наступил очередной этап развития Интернета. В ответ на запрос пользователя выдавалась не пара тематических сайтов, а тысячи. Быстро определить, что из предоставленного имеет ценность, было невозможно. Среди выдаваемого списка сайтов присутствовали как высококачественные ресурсы, так и бесполезные. Для отсева нужного от ненужного и был разработан алгоритм определения релевантности. За счет него люди вновь могли получить желаемую информацию быстро, не разбирая груду лишних документов.
Сразу после создания программа-поисковик в определении релевантности руководствовалась исключительно внутренними параметрами рассматриваемого сайта. Такими критериями были:
Изобретение и распространение дорвеев (doorway) изменило всё. Эти специальные страницы содержали только слова из популярных запросов. Их цель — поднять рейтинг сайта в таблице выдачи бота. При переходе на такую страницу-наживку пользователь перенаправлялся на другой сайт или страницу. Для борьбы с данным жульничеством потребовалось создать систему оценки внешних критериев портала. Упрощенно данный алгоритм можно описать следующей формулой:
Р = Н × ( В + С ),
где:
Обдумав данное математическое выражение, можно понять принцип оценки релевантности современными поисковыми роботами. Реальная работа алгоритма гораздо сложнее, и ее смысл не уместится в формулу, которая лишь дает сведения о главных учитываемых параметрах.
Поисковая система оценивает внутреннюю релевантность портала путем подсчета количества искомых фраз на статью. Так, наиболее часто повторяемое слово программа сочтет ключевым.
При совпадении введенной человеком фразы с самой повторяемой последовательностью слов на сайте этот ресурс будет сочтен релевантным. Такое наиболее повторяемое предложение или слово вычисляется поисковиком для каждого портала.
Большое значение имеет не только наличие на странице сайта всех слов, введенных пользователем, но и их последовательность. Кроме того, учитывается расположение фраз в иерархии текста. Наибольшее значение придается словам в названиях. Если статья озаглавлена в той же формулировке, что и запрос посетителя, то релевантность портала для данного запроса будет высокой. Также учитываются и другие критерии важности слов-ключей, представленные ниже.
А также поисковый робот отмечает тематику ресурса и, если она полностью совпадает с запросом, выдает этот сайт как результат.
Для оценки этого вида соответствия сайта используется термин ссылочной популярности. Величина этого критерия зависит от цитируемости обследуемого ресурса другими порталами. Авторитетность сайта зависит в данном случае от количества ссылок на него, размещенных на сторонних площадках. Таким образом, популярность в сети напрямую влияет на оценку качества контента. Алгоритм оценки внешней релевантности сохранил суть со времени своего изобретения основателями компании Google. С того момента он подвергся многим доработкам и работает до сих пор. Руководствуясь количеством найденных ссылок на сайт, поисковая система составляет PageRank — коэффициент, отражающий внешнюю релевантность ресурса.
Яндекс обзавелся своим клоном PR. Для составления критерия авторитетности сайта в 2001 году был разработан ВИЦ. Аббревиатура дословно расшифровывается как взвешенный индекс цитирования. Эта величина была ранее доступна, но в 2002 году ее скрыли от глаз пользователей из-за попыток ее накрутки. Сейчас есть возможность ознакомления лишь с критерием ТИЦ, который задействован для упорядочения сайтов в реестре Яндекса.
ИЦ используется и Рамблером тоже. Но данный индекс используется совместно с рейтингом посещений сайта пользователями. Система Рамблер улучшена этой технологией с 2002 года.
Первой программой, включившей в свой алгоритм ИЦ, была система «Апорт». Переменная была введена в 1999 году. В этом поисковике индекс составлялся лишь на основании самой значимой ссылки, полученной с наиболее популярного сайта.
Релевантность веб-страниц — это оценочное понятие, которое активно используется в сфере поискового продвижения и оптимизации сайтов. Проблемы, связанные с поиском соответствующей информации, становятся основной причиной падения уровня конверсии веб-площадок.
Если представитель целевой аудитории не может найти на страницах сайта необходимый ему контент (текст, аудиозапись, видеофайл, изображение), он приступает к поиску альтернативного источника для получения информации. Иными словами, посетитель уходит с сайта к одному из конкурентов, умеющему размещать качественный и актуальный контент.
Формально исследование релевантности в области информационного поиска началось в середине прошлого века. Новая отрасль изучения позже получила называние библиометрики. Особое внимание в ходе ранних исследований уделялось поиску актуальных и точных текстов, отвечающих на конкретный вопрос.
С развитием и глобализацией Интернета информационный поток значительно увеличился. Появилось огромное количество нерелевантных веб-страниц, которые заточены исключительно под индексацию в поисковых системах. В результате появилось понятие технической релевантности. Во многом именно желание подстроиться под современные требования Яндекса и Google привело к значительному увеличению количества нерелевантных сайтов.
Причины падения релевантности веб-страниц
В некоторых случаях запрос может иметь неоднозначную интерпретацию или различные правильные ответы, поэтому при оценке полезности веб-страниц учитывается разнообразие результатов. Наиболее релевантные веб-страницы необязательно являются самыми полезными для пользователя. Отображение сайта на первой странице в результатах поиска также не стоит приравнивать к высокому качеству общей релевантности. Временные передовые позиции в поисковой выдаче часто занимают сайты, хорошо оптимизированные с технической стороны.
Релевантность по ключевому запросу с точки зрения обычной поисковой системы — полученное после анализа соотношение количества запросов и остальных слов/словосочетаний в тексте. Качество самого контента при этом не оценивается. Для преодоления подобного недостатка была предложена специальная мера, называемая «максимальной предельной релевантностью» (MMR). В ее рамках рассчитывается актуальность каждого документа только с точки зрения того, сколько новой информации он приносит на фоне и с учетом предыдущих результатов.
Релевантность контента влияет на процесс индексации и ранжирования сайта. Проблемы с оптимизацией информации приводят к сокращению уровня конверсии. Даже если страницы оптимизированы под требования поисковика, низкое качество контента со временем приведет к оттоку посетителей. Специалисты в области поискового продвижения предоставляют несколько полезных советов, связанных с повышением уровня релевантности.
Представитель целевой аудитории покинет сайт, на котором предоставлена хоть и хорошо технически оптимизированная, но устаревшая информация. Современные алгоритмы работы роботов поисковых систем учитывают поведенческие факторы, поэтому со временем веб-страница потеряет и свою техническую релевантность (позиции в топе выдачи снизятся).
Методы повышения релевантности сайта
Принцип релевантности предполагает использование на веб-страницах уникальных, полезных, актуальных и интересных текстов, разбавленных тематическим визуальным контентом (изображения, анимация и видеоролики). Поисковик — это роботизированная система, работающая по заранее прописанным алгоритмам. Во время индексации поисковая машина не в состоянии проверить красоту написания или актуальность текста. Реальную оценку релевантности сайта можно получить лишь в процессе личного изучения веб-станиц.
Владельцу сайта рекомендуется проследить за реакцией посетителей. Если речь заходит о площадке, нацеленной на диалог с представителями целевой аудитории, можно запустить опрос, в котором посетители отметят факторы, по их мнению, снижающие уровень релевантности веб-страниц.
Эффективные способы повысить релевантность страницы позволят удержать сайт на лидирующих местах в поисковой выдаче. Оптимизируя площадку под поисковое продвижение, следует также не забывать о прочих инструментах SEO. Только комплексный подход к раскрутке сайта позволит повысить уровень конверсии.