Факторы ранжирования на странице. Онлайн ранжирование


Ранжирование

Ранжирование – распределение чего-либо по его рангу, авторитету, ценности и другим показателям. С точки зрения SEO, ранжирование – это распределение ссылок на Интернет-ресурсы на странице выдачи результатов поиска согласно их релевантности. Результатом ранжирования сайтов является страница, которую видит пользователь в качестве ответа на свой запрос в поисковой системе.Механизм работы

Любая поисковая система, будь то Google или Яндекс, проводит ранжирование сайтов, которые соответствуют тематике поискового запроса и содержат соответствующие ключевые слова. Естественно, под ранжирование попадают все Интернет-ресурсы, проиндексированные данной поисковой машиной. Список ссылок, который видит пользователей, составляется уже после ранжирования сайтов по релевантности – первыми расположены наиболее релевантные по мнению данного поисковика сайты, и далее по убыванию.

Каждая поисковая машина при ранжировании учитывает свои показатели (такие, например, как PageRank, ссылочная масса и т.д.). Факторы, по которым определяется положение сайта в выдаче результатов, могут быть как внутренними, так и внешними. Таким образом, один и тот же ресурс может попасть на разные места на странице выдачи в разных поисковых системах.

Критерии ранжированияОбщим фактором, влияющим на ранжирование, является первый критерий - релевантность сайтов с точки зрения данной поисковой машины. Для определения релевантности в первую очередь анализируется содержание сайта, для чего проводится лексический и семантический анализ его контента. Этот критерий применяется поисковыми системами с 1993 года и изначально был единственным фактором, влияющим на размещение ссылок на странице выдачи поисковых результатов.

Так как такая схема ранжирования не избавляла пользователей от спама, был выведен второй критерий, влияющий на ранжирование – это формальный алгоритм, используемый данной системой для фильтрации, например, спама или "некачественных" сайтов. Точные алгоритмы не афишируются, и к тому же меняются время от времени, чтобы максимально снизить количество сайтов, вышедших на первые места с помощью черной оптимизации.С 1998 года был введен и третий критерий – ссылочная масса сайта. Она по-своему рассчитывается различными поисковиками, но всегда учитывает количество и качество внешних ссылок на конкретную страницу или на весь сайт в целом.

Четвертый критерий – это факторы-показатели качества сайта: доменное имя, доменная зона, уровень домена, год создания сайта и т.д. Он стал актуален после того, как в 2004 году доменные имена активно продавались и покупались. Пятый критерий ранжирования – это набор поведенческих характеристик ресурса, то есть, частота обновления контента, смена хозяев доменного имени, авторитет сайта и т.д. И, наконец, последний, шестой критерий, по которому проводится ранжирование, - это социальные факторы. Социальные факторы – это не только интеграция с социальными сетями, но и удобство ресурса для пользователя, интуитивно понятный интерфейс и т.д.

www.cy-pr.com

Ранжирование страниц поисковиками – два этапа ранжирования

Два этапа ранжирование страниц поисковиками

В общих чертах, ранжирование страниц поисковиками делится на два этапа:

  1. Выбор поисковиком самой релевантной страницы каждого сайта, по данному запросу;
  2. Расчет значения релевантности для каждой страницы сайта.

Разберем процесс ранжирования подробнее.

Процесс ранжирования

Понятно, что на одном сайте может быть не одна, а несколько страниц, соответствующих запросу пользователя. Поисковик из этих страниц выбирает одну страницу, по его алгоритму, более релевантную (читать про релевантность).

Как правило, поисковик в выдаче по одному запросу показывает одну страницу сайта, наиболее релевантную. Отсюда простое правило продвижения и оптимизации: один запрос — одна страница сайта. Правда сейчас это правило нарушается и поисковики выдают несколько страниц сайта по одному запросу.

На самом деле Яндекс показывает одну наиболее релевантную страницу, а Google легко покажет список не выбирая.

Расчет поисковиком показателя релевантности страницы, определяется сложными, многоуровневыми формулами, в которых учитываются разнообразные факторы и комбинации факторов. Главным фактором релевантности является степень соответствия содержания страницы введенному пользователем запросу.

Некоторые поисковики, например Яндекс, добавляют к фактору соответствия содержания региональное расположение сайта.

Выше перечисленные два фактора это всего лишь первая фильтрация.

Факторы релевантности второго этапа

Статические факторы страницы. Эти факторы связаны напрямую с самой страницей. Это количество и качество ссылок на эту страницу, возраст домена и самой страницы, технические и поведенческие показатели сайта и оцениваемой страницы;

Уточняющие факторы запроса. Это факторы сортировки страниц по типу запроса:  география, коммерция, навигация и т.д.;

Динамические факторы страницы. Это прямые связи запроса с текстом страницы: есть ли в тексте слова запроса, сколько их, как они расположены, сколько ссылок с анкором, совпадающим с ключевиком,  сколько вообще информации на сайте по анализируемому запросу.

Санкции, занижающие ранжирование в поисковой выдаче

Санкции, занижающие ранжирование в поисковой выдаче или факторы пессимизации, это правила поисковиков, по которым они могут намеренно занижать позиции страниц в выдаче. По-другому они называются фильтры поисковых систем. Понимание и знание, что такое ранжирование страниц поисковиками важно для каждого оптимизатора.

©Seojus.ru.

Другие статьи раздела: Теория SEO

(Всего просмотров 149)

Статьи по теме

Поделиться ссылкой:

seojus.ru

Ранжирование сайта

Ранжирование сайта: факторы ранжирования

... или как отвоевать "место под солнцем" для нашего сайта...  Читать далее:

  Ранжирование сайта — это процесс, при котором поисковый робот, производя анализ сайта и его страниц, присваивает конкретной странице определенное место в списке выдаче по какому-либо поисковому запросу.

  Одним словом - ранжированием называется присвоение поисковым роботом ранга страницы в поисковой выдаче по запросу пользователя. По сути, это следующий процесс после индексации сайта.

  Важнейшей задачей SEO продвижения является получение максимально высоких позиций в SERP (поисковой выдаче). Чтобы решить эту задачу, нужно добиться максимального соответствия требованиям, предъявляемым поисковым роботом.

  Звучит не так уж и сложно, но проблема в том, что ни одному оптимизатору досконально не известны механизмы отбора, применяемые роботом и факторы, учитываемые им при ранжировании интернет-ресурсов.

  Именно поэтому в этой работе оптимизаторы полаюгаются на:

  Вот почему, имея бизнес в Интернете, многие владельца сайтов стараются доверить их оптимизацию специалистам со стажем, которые уже долго наблюдают за процессом ранжирования и знают некоторые секреты того, как подняться в верхние строки выдачи.

  В этом вопросе практика в изучении факторов, влияющих на ранжирование, невероятно важна. А собственно, о каких конкретно факторах идет речь?

  Для начала разберемся с поисковыми алгоритмами ранжирования сайтов.

Алгоритмы ранжирования сайтов

  Алгоритмы ранжирования это комплекс поисковых алгоритмов которые определяют рейтинг сайтов на наиболее точное соответствие тому или иному поисковому запросу.

  Алгоритмы ранжирования подробно изучают каждую страницу по многочисленным критериям и на основании результатов осуществляют сортировку. Со временем алгоритмы ранжирования поисковых систем эволюционируют - начинают учитывать все новые факторы.

Алгоритмы ранжирования сайтов в Яндексе

  МатриксНет - система машинного ранжирования поисковых алгоритмов Яндекса, которая носит название MatrixNet. В основе данного алгоритма учитывается формула, построенная на оценке специально обученных людей (асессоров).

  Эти самые асессоры отбирают несколько ресурсов и оценивают их, учитывая множество различных факторов, тем самым обучая поисковую машину мыслить. А уже после, обученные алгоритмы поисковой системы, основываясь на оценках и факторах асессоров, распространяют полученные знания на другие ресурсы в сети.

  Факторов, которые учитываются алгоритмами Яндекса при ранжировании сайта насчитывается более тысячи.Всегда следует учитывать пессимизирующие факторы (так называемые фильтры) при разработке сайта и помнить, что однобокое продвижение сайта (например, только ссылочное) в настоящее время уже невозможно.

Какие же факторы ранжирования следует учитывать при комплексном продвижении сайта?

Факторы ранжирования сайта

  Чтобы понять, что конкретно влияет на поднятие сайта «по служебной лестнице», нужно провести анализ влияющих на этот процесс факторов. Внимание следует уделить двум неразделимым аспектам: это внутренние и внешние факторы.

Внутренние факторы ранжирования сайтов

  Каковы же внутренние факторы ранжирования сайтов позволяющие лидерам «взбираться» на самую вершину списка поисковой выдачи? Давайте разбираться.

  Фактор, которому поисковые системы придают решающее значение.

  Именно текст заголовка страницы отображается на странице выдачи результатов поиска. Если текст заголовка отвечает на  запрос пользователя, то он обязательно перейдет по ссылке на наш сайт.

  Отсюда следует, что наличие, заполненность и точность содержимого тега title – первостепенная задача при поисковом продвижении.

  В идеале заголовок не должен превышать 50 символов с пробелами и представлять из себя точное вхождение ключевого запроса по которому продвигается страница.

  Наличие и выделение ключевых слов на продвигаемой странице. важным элементом является прописывание ключевых слов в тегах h2-h6. Выделение жирным шрифтом.

  Расположение ключевых слов на странице. Здесь правило очень простое – чем ближе ключевое слово (ключевая фраза) к началу документа, тем больший вес такой документ (страница сайта, пост блога) получает в глазах поисковой системы. Это связано с тем, что поисковый робот читает для индексирования любую страницу веб-ресурса с ее начала, а не с конца.

  Количество ключевых слов на странице. Самый важный момент этого правила – чем больше общий объем текста, тем больше повторений ключевого слова можно сделать. Минимум эти ключевики могут встречаться 3-4 раза. Если фраза состоит из нескольких слов, то наилучшие результаты получаются в том случае, когда она в тексте есть несколько раз в точном вхождении при оптимизации текста (все слова вместе в первичном порядке) и плюс к этому, когда эти слова из фразы попадаются в тексте пару раз поодиночке.

  Плотность ключевых слов. Плотность слов – это относительная частота содержания слов в тексте. Например, если одно слово встречается 7 раз на 100, то его плотность будет 7%. Если этот параметр будет слишком низким, то поисковая система проигнорирует целевую страницу, по которому продвигается данное слово (она будет далеко за пределами топ-30). Слишком же большая плотность может вызвать сомнения у поисковых систем в целесообразности нахождения в топ-10 этой страницы, что в результате трансформируется в наложение спам-фильтра.

  Ключевые слова в тексте ссылок. Многие знают, что текст ссылок (анкор) тоже играет свою роль при ранжировании. Поэтому необходимо использовать ключевые слова в описании линка, причем не важно – исходит она на внешний веб-ресурс или идет на другую страницу сайта владельца.

  Объем текста на странице. Для поисковых систем самые лучшие те сайты, которые содержат уникальную и ценную информацию. Чем больше веб-ресурс располагает эксклюзивными данными, тем важнее он для пользователя сети Интернет.

  А значит его документы будут ранжироваться выше, чем документы других сайтов. Обычно оптимальные страницы содержат от 500 до 3000 слов или от 2 до 18 тыс. символов. Если же целевая страница состоит всего лишь из нескольких предложений, у нее меньше шансов попасть в первую десятку лучших результатов.

  Информативное и стилистическое оформление текста. Поисковая система считает, что текст с понятной навигацией, выделенным текстом, с таблицами и списками внутри наиболее интересен пользователю, чем сплошная простыня из букв.

  В принципе это верно, ведь далеко не каждый читатель будет рыться в большом потоке букв – на поиск нужной информации может уйти много времени и сил. Поэтому для лучшего восприятия текста seo-специалисты используют возможности языка html при оформлении.

  Большое количество текста на странице не только повышает шансы на попадание в топ, но и улучшает ее видимость в поисковых системах. Это связано с тем, что чем длиннее текст, тем больше редких или случайных поисковых фраз он содержит, а значит может давать дополнительный приток посетителей.

Внешние факторы ранжирования сайтов

  Не стоит начинать сразу с очень большого числа факторов, лучше остановиться на самых значимых моментах, это позволит избежать ошибок и произвести анализ быстрее и точнее. Обнаружив недоработки, следует приложить максимум усилий для их исправления с целью увидеть результаты своих усилий в списке поисковой  выдачи.

 

 

mlm-seo.ru

Факторы ранжирования на странице

Сегодня мы переводим часть исследования от компании Backlinko под названием «Google’s 200 Ranking Factors: The Complete List» за апрель 2016 года. В котором Браян Дин в Backlinko провел детальный анализ наиболее значимых (популярных) факторов ранжирования.

Все, наверное, слышали, что Google использует около 200 факторов ранжирования в своих алгоритмах, некоторые из них доказаны, некоторые из них являются спорными, но в этом цикле статей мы рассмотрим все из них.

#1 — Ключевое слово в Title

Title вторая из наиболее важной частей веб-страницы, после собственно содержания страницы, и поэтому это сильный сигнал для SEO на странице.

#2 — Title начинается с ключевого слова

По данным Moz, Title, который начинается с ключевого слова, как правило лучше ранжируется, чем Title с ключевым словом к концу тега.

#3 — Ключевое слово в Description

Второстепенный сигнал, но уместный. Не особенно сейчас важный, но все же имеет некоторое значение.

#4 — Ключевое слово в h2

Тег h2, «второй тег заголовка», который посылает второй сигнал по релевантности в Google, в соответствии с многими исследованиями, имеет важное значение.

#5 — Ключевое слово наиболее часто используется на странице

Ключевое слово появляется чаще, чем любые другие слова, вероятно действует как сигнал ранжирования.

#6 — Длина контента

Содержимое с большим количеством слов, может охватывать более широко интересующий запрос пользователя и, вероятно, более предпочтительна перед короткими и поверхностными статьями. Компания SERPIQ обнаружила, что длина контента коррелируется с позицией SERP

#7 — Плотность ключевых слов

Хотя это и не так важно, как было раньше, плотность ключевых слов все еще используется Google, чтобы определить тему страницы. Но переспам может причинить значительный вред.

#8 — Важные релевантные термины (ВРТ)

Важные релевантные термины помогают поисковым системам понять смысл слов с разными значениями (Apple — компьютер или фрукт). Наличие / отсутствие ВРТ, вероятно, также действует как сигнал качества контента.

Соответствующие семантически термины указывают на качественность содержания. Если, например, статья о «фильтре Panda», соответствующими терминами могут быть «Google» или «рейтинг» или «поисковая оптимизация».

Процент важных релевантных терминов в ТОП 30 является относительно высоким и даже увеличился по сравнению с прошлыми годами. Страницы в ТОП 10 являются гораздо более целостными.

#9 — Важные релевантные термины (ВРТ) в названии и описании

Как и в основном содержании, ВРТ в мета-тегах, вероятно, помогает Google различать синонимы и выступает в качестве сигнала релевантности.

#10 — Скорость загрузки страницы

Google и Bing используют скорость загрузки страницы как фактор ранжирования, пауки поисковых систем могут довольно точно оценить скорость сайта и размер файла.

Google может также использовать пользовательские данные с своего браузера Chrome, чтобы получить данные времени загрузки страницы, скорость ответа сервера и других сигналов загрузки сайта.

#11 — Дублированный контент

Идентичное содержание, даже слегка измененное, может негативно повлиять на видимость в поисковой системе.

#12 — Rel = Canonical

При правильном использовании этого тега, он может предотвратить возможность рассмотрения Google — страниц с дублированным контентом.

#13 — Оптимизация изображений

Изображения на странице отправляет поисковой системы важный сигнал релевантности: имя файла, alt текст, название, описание и подпись.

#14 — Давность обновления содержания

Обновление как кофеин для Google, подчеркивая важность этого фактора, Google показывает дату последнего обновления для определенных страниц.

#15 — Масштабы обновления содержания

Размер правок также является фактором свежести. Добавление или удаление целых разделов является более существенным обновлением, нежели поменять местами несколько слов.

#16 – Частота обновления страницы

Как часто страница обновлялась в течении времени? Ежедневно, еженедельно, раз в 5 лет? Частота обновления страницы также играют определенную роль.

#17 – Как высоко размещено ключевое слово

Наличие ключевого слова в первых 100 словах страницы, существенный сигнал ранжирования.

#18 — Ключевое слово в h3, h4

Ключевое слово в подзаголовках h3 или h4 может быть слабым сигнал ранжирования.

#19 — Точное соответствие ключевого слова

Точное совпадение ключевого слова, как правило, дает более высокий рейтинг, чем та же фраза в не точном соответствие.

#20 — Исходящие ссылки

Многие оптимизаторы сходятся в мыслях, что ссылки на авторитетные сайта вашей отрасли, посылают сигналы доверие поисковым системам.

Согласно Moz, поисковые системы могут использовать содержание страницы, на которую вы ссылаетесь в качестве сигнала релевантности. Например, если у вас страница об автомобилях, то ссылка на страницу о кино, может сказать Google, что ваша страница о фильмах о автомобилях, а не о автомобилях.

#21 — Грамматика и правописание

Правильная грамматика и орфография является сигналом качества контента, хотя Каттс дал смешанную оценку как фактору ранжирования в 2011 году.

#22 – Мультимедиа

Изображения, видео и другие мультимедийные элементы могут выступать в качестве сигнала качества контента.

#23 — Количество внутренних ссылок, указывающих на страницу

Количество внутренних ссылок на страницу указывает на ее важность относительно других страниц на сайте. Внутренние ссылки с авторитетных страниц вашего домена имеют более сильный эффект, чем страницы с низким PR.

#24 — Неработающие ссылки

Слишком много битых ссылок на странице может быть признаком запущенного или брошенного сайта. Google использует неработающие ссылки в качестве оценки качества страниц.

#25 — Партнерские ссылки

Партнерские ссылки сами по себе, вероятно, не повредят вашему сайту. Но если у вас их слишком много, алгоритм Google может обратить более пристальное внимание на другие сигналы качества вашего ресурса.

#26 — HTML ошибки / валидность кода

Много ошибок или неаккуратное кодирование может быть признаком плохого качества сайта. В то время, это спорное утверждение, многие специалисты SEO думают, что это слабый сигнал качества.

#27 – Домен

При прочих равных, страница на доверенном домене будет иметь преимущества.

#28 – PageRank

Нет точной корреляции. Но в целом страницы с более высоким PR, как правило имеют лучшие позиции.

#29 — Длина URL

Search Engine Journal отмечает, что чрезмерно длинные URL-адреса могут повредить поисковой видимости. Вложенность в пути URL: чем ближе страница к домашней странице, тем больше получит небольшое повышение авторитета.30. Ключевое слово в URL: Другой важный сигнал релевантности.

#31 — Ссылки и источники

Ссылки на источники, научные работы, могут быть признаком качества. Руководство по качеству Google утверждает, что необходимо указывать источники, это повышает пользовательский опыт. Тем не менее, Google отрицает, что они используют внешние ссылки в качестве сигнала ранжирования.

#32 – Списки

Список облегчает усвоение материала и делает его более удобным для читателей, Google, вероятно, соглашается с этим, и, возможно учитывает их как слабый сигнал ранжирования.

#33 — Приоритет страницы в Sitemap

Приоритет страницы в файле sitemap.xml может влиять на ранжирование.

#34 – Возраст страницы

Хотя Google предпочитает свежий контент, старая страница, которая регулярно обновляется будет иметь преимущества при прочих равных перед новой страницей.

#35 — Припаркованные Домены

После обновление алгоритмов Google в декабре 2011 года, значительно снизилась видимость припаркованных доменов.

Другие статьи:

Домен как фактор ранжирования в GoogleТехнические факторы ранжирования сайтов в GoogleКлючевые слова как фактор ранжирования в 2016Поведенческие факторы ранжирования (User Experience) в 2016 годуФакторы ранжирования на уровне сайта

online-marketing.com.ua

Факторы, влияющие на ранжирования сайтов

Все известные современные поисковые системы стремятся к тому, чтобы пользователи сети Интернет, вводя свои запросы, попадали именно на те сайты, на которых находится необходимая информация. А оптимизация сайтов как раз и является очень важным фактором, пренебрегать которым современным вебмастерам просто запрещено.

Порядок выдачи интернет ресурсов после того как будет введен поисковый запрос называется ранжированием, а соответствие смыслу информации, находящейся на данных ресурсах по заданному запросу именуется релевантностью. Релевантность контента зависит от количества ключевых фраз используемых в тексте (норма – от 3 до 3,5%). Многие из оптимизаторов повышают уникальность контента, жертвуя его читабельностью, увеличивая при этом «тошнотность» текстов, но скажем честно, процент уникальности таких жертв не достоин. Как видно из практики, качественный копирайт (рерайт) с 90%-ной уникальностью будет ранжироваться поисковиками порядком выше, чем плохо воспринимаемая информация с уникальностью в 100%.

Весьма важным фактором, влияющим на ранжирование сайтов, считается использование заголовков и жирного шрифта. Причина тому восприятие поисковыми системами выделенных «жирным» текстов, как заголовков, несущих самую большую информационную нагрузку, касающегося этого контента.

Положительно на ранжирование сайтов (даже не раскрученных, а только созданных) влияет внутренняя перелинковка. Смысл этого процесса заключается в связывании внутренних страниц вашего ресурса между собой посредством внутренних ссылок. Внутренняя перелинковка способна нарастить вес каждой отдельно взятой страницы сайта.

Также поднять в ранге ваш ресурс помогут внешние ссылки, а также размещение вашего сайта в популярных на сегодня моделируемых каталогах, скажем таких, как Яндекс Каталог, DMOZ и т.п.

Полезный сайт: Как вы понимаете, спальня в квартире является местом, где можно спокойно отдохнуть, возвратившись домой после трудного рабочего дня. И лучше всего приобрести мебель для спальни в Москве в интернет-магазине, ведь это сэкономит вам время на поиски подходящей именно вам модели (размер, цвет, дизайн, декор и т.п.), да и к тому же избавит от необходимости искать способы ее перевозки – продавец доставит вашу мебель по указанному адресу в кратчайшие сроки в удобное для вас время.

alexandrshikhov.ru

Ранжирование сайтов по коммерческим запросам. Доклад Яндекса

Ключевой подход к ранжированию сайтов по коммерческим запросам.(Ключевые принципы ранжирования коммерческих сайтов)

Аннотация

Современные поисковые системы достаточно хороши для того, чтобы соотносить популярные коммерческие запросы с релевантными выдачами. Однако наши исследования говорят о том, что поведение пользователей на одном коммерческом сайте, релевантном запросу, может быть отличным от поведения на другом таком же сайте. Таким образом, поисковые системы оказываются перед проблемой ранжирования результатов, которые одинаково релевантны с точки зрения традиционного подхода к ранжированию. Чтобы решить эту проблему, мы предлагаем рассмотреть дополнительные аспекты (факторы) релевантности, такие как надежность, удобство и простота использования, качество дизайна и качество обслуживания. Для того, чтобы позволить алгоритму ранжирования принять эти аспекты в счет, мы предложили ряд особенностей, определив качество страницы по обозначенным (предлагаемым) параметрам. Мы свели новые аспекты в единую метку, коммерческую релевантность, которая в совокупности представляет собой качество сайта. Мы экстраполировали метку коммерческой релевантности на все рассматриваемые наборы данных и по умолчанию использовали полученную сумму коммерческих и общих результатов вместо меток релевантности. Для оценки нашего метода мы создали DCG-метрику и провели чередующиеся офлайновые и онлайн эксперименты, которые показали, что данный алгоритм ранжирования, принимающий во внимание предложенные аспекты релевантности, наиболее соответствует предпочтениям пользователей.

Ключевые слова:Обучение ранжированию, веб-поиск, критерий релевантности

1. Введение

Единственная цель поисковой системы при некоторых информационных запросах состоит в том, чтобы найти только самый релевантный запросу документ. В случае, когда выдача релевантных документов невелика, это наиболее подходящий, в соответствии с потребностью пользователя, вариант. Однако в настоящее время существует множество запросов пользователей, по которым поисковая система может выдать большое количество высоко релевантных результатов. Такие запросы сопряжены с выдачей возможных результатов на выбор, в отличие от поиска одного единственного результата. Эти группы пользовательских запросов включают в частности коммерческие запросы, где клиенты часто хотят сами выбрать наилучший вариант из множества предложенных.

Коммерческие запросы формируют высоко конкурентную среду, где высокие позиции в результатах поиска ведут к росту дохода. Поэтому, чтобы увеличить прибыль, владельцы коммерческих сайтов делают все, чтобы занять первые места в результатах поиска. Вебмастера оптимизируют текстовый контент и покупают входящие (внешние) ссылки, чтобы поисковой системы легче было обнаружить сайт и предложить его пользователю по коммерческому запросу. В результате, с точки зрения контента и качества основной ссылки, все сайты в топ-10 часто одинаковы релевантны. Кроме того, фокус группы также дают высокую оценку релевантности для многих конкурирующих сайтов, при этом их критерии оценки, в первую очередь, ориентированы на тематическую релевантность документов.* Таким образом, любое изменение позиций сайтов в топ-10 не ведет к изменению качества ранжирования в метрике.

*http://plg.uwaterloo.ca/∼trecweb/2012.html

Однако, бросая все силы на поисковую оптимизацию, многие вебмастера забывают об оптимизации, ориентированной на пользователя.[13] Поэтому степень удовлетворенности пользователей коммерческими сайтами может быть существенно разной. В частности дизайн, присутствие механизма обратной онлайн связи, отзывы о предлагаемых продуктах имеют значимое влияние на работу (поведение) клиента на сайте.

Эти наблюдения дают представление о том, что информация о качестве сайта имеет важное значение при ранжировании по коммерческим запросам, которые предполагают множество релевантных результатов, и может значительно улучшить и ранжирование, и удовлетворенность пользователей. Качество документа по коммерческому запросу при условии тематической релевантности называется коммерческой релевантностью.

Есть работы, в которых авторы предлагают подходы к оценке качества сайта и его интеграции в алгоритм ранжирования. Например, во многих работах критерии качества веб-страницы, с точки зрения пользовательского поведения, были описаны на основе данных интервью[1, 2, 11]. Формальные критерии, которые характеризуют удобство, доверие, дизайн и др. должны быть выстроены на основе значимости отдельных аспектов качества сайта для пользователей. К таким аспектам могут относиться длина текста, содержание грамотности, заголовки страниц, наглядность, наличие карт, информация о компании, легко запоминающиеся номера телефонов, бесплатная доставка.[7]

Есть некоторые работы, которые предполагают подходы к использованию дополнительных знаний о качестве сайта в рейтингах.[3] Например, агрегирование таких данных, как мнение фокус-группы и информация о кликах [4], или текстовая релевантность и время публикации. [6]

В нашей статье мы предлагаем новый качественно ориентированный подход к ранжированию, который включает в себя создание новых аспектов релевантности и использование особенностей, включающих в себя качество страницы по обозначенным параметрам. На основе нескольких аспектов качества мы формируем суммарный рейтинг, который называется коммерческой релевантностью. Для сравнения, мы экстраполируем коммерческие метки релевантности ко всему списку ранжирования. Для местно релевантных результатов поиска мы используем объединенную метку релевантности как суммарный результат тематического и коммерческого множества. По с равнению с методом ранжирования по умолчанию, наш метод значительно улучшает как оффлайн, так и он-лайн метрику.

Дальше наша статья построена следующим образом:

2. Шкала коммерческой релевантности

Для оценки качества сайта по коммерческому запросу можно использовать мнение фокус-группы или данные о кликах.[9]Мы решили использовать метки экспертов, потому что их данные менее «шумные» в отличие от данных кликов или панели инструментов.[14]

При использовании информации о кликах или данных панели инструментов, очень сложно определить, удовлетворен ли пользователь результатом поиска. Поведение пользователей с коммерческими намерениями может сильно различаться в зависимости от категории продукта, его цены и много другого (к примеру сравним доставку пиццы и покупку объектива к цифровой камере). С другой стороны, данные панели инструментов и информация о кликах могут принести некоторую полезную информацию, поэтому мы сделали их доступными для экспертов в процессе оценки.

Бывают ситуации, когда каждый из экспертов поставит метку качества разные параметры. Возможно, что кто-то знает сайт и доверяет ему, не смотря на ужасный дизайн и плохое юзабилити. Другой аудитор обратит свое внимание на обязательное наличие отзывов от пользователей и т.д. Для улучшения работы мы формализовали процесс оценки сайта, выделив основные компоненты качества. В то же время это позволило сделать более широкий охват экспертных мнений.

На основании данных многочисленных исследований [5, 11, 12], мы определили расширенный список аспектов коммерческой релевантности. Затем, в целях облегчения процесса оценки, мы выбрали четыре метки качества, которые, мы считаем, охватывают большую часть независимой информации о качестве. Это значит, что эти метки включают в себя наибольшую информацию о возможностях сайта. Перечень выбранных показателей качества выглядит следующим образом: надежность, удобство использования, качество дизайна и качества обслуживания.

Мы разработали подробную инструкцию по оценке качества сайта для экспертов. В соответствии с этими инструкциями, оценка состоит из двух этапов. Во-первых, оценщик должен определить, является ли результат поиска местно релевантным для данного запроса. Мы используем широкую 5-бальную шкалу оценки местной релевантности, включающую такие значения — нерелевантна, релевантна, высоко релевантна, полезно и очень важно. Оценка качества сайта является гораздо более сложным и трудоемким процессом, чем оценка местной релевантности (и особенно, чем получение качественной информации о кликах). От части это компенсируется тем, что в нашем методе результата поиска должен быть оценен только для релевантных.

Мы не рассматриваем документы с полезной и очень важной меткой, предполагая, что они часто являются единственной выдачей поиска для конкретного запроса. Как упоминалось ранее, мы ориентируемся только на запросы, которые подразумевают выбор между одинаково подходящими результатами.

На первом этапе оценки различные продукты и услуги, предоставляемые результатом поиска по коммерческому запросу, также оцениваются. Мы выделяем три вида ассортимента: маленький, стандартный и большой. Оценку (The variety score ) по запросу Q для документа D обозначим как V (q, d).

На втором этапе оценки определяем по всему сайту надежность, удобство использования, качество дизайна и качество обслуживания. Надежность и качество обслуживания по нашей шкале имеют четыре степени — спам, нормальное, хорошее и совершенное.

Сайт будет помечен как спам, если он не позволяет сделать покупку или получить нужную услугу (это подделка сайта). Сайты с меткой «нормально», это не плохой сайт, но не отличающийся от тысяч подобных коммерческих сайтов. Хорошие сайты предоставляют пользователям стандартный набор услуг и, наконец, отличные сайтыизвестные лидеры рынка. Надежность и качество обслуживания сайта обозначаются T (s) и S (s) соответственно. Обратите внимание, что эти оценки не зависят от конкретной пары запроса Q и D документа.

Юзабилити и дизайн имеют только три степени качества: плохое, хорошее, и совершенное. Оценка аспекта коммерческой релевантности обозначается через U( s) для юзабилити и D(s) для качества дизайна. Значение оценок от 0 до 1.

Для будущего использования качественной информации в процессе обучения ранжированию мы объединили четырехмерную метку в одну оценку коммерческой релевантности:

Rc (q, d, s) = V (q, d) · (2T (s) + U (s) + D(s) + 2S(s)), (1)

где Rc (Q, D, S) является оценкой коммерческой релевантности для конкретныхзапросов Q и D документа с сайта s.

Значение надежности и качества обслуживания сайта вдвое больше значения других аспектов качества сайта. Это сделано по той причине, что эти критерии наиболее важны для удовлетворенности пользователей сайтом. Но не рассматрниваем эти параметры как единственно возможные.

3. Обучение ранжировать с учетом новых аспектов

Оценка коммерческой релевантности очень сложная задача, так как при фиксированных затратах выдача коммерческих результатов будет меньше выдачи тематических результатов. Мы не можем отказаться от соответствующих тематически релевантных результатов, не являющихся коммерчески релевантными. Это может привести к значительному снижению обучения ранжировать и, как следствие, может послужить причиной ухудшения качества функции ранжировать.

Таким образом, перед началом процесса обучения ранжировать мы должны экстрополировать метку коммерческой релевантности для всех данных обучения ранжировать. Подобная процедура экстрополяции состоит из двух этапов. Во-первых, мы готовим функцию ранжирования на небольшую выдачу, только для коммерчески релевантных результатов. Полученная функция ранжирования дает нам оценочную стоимость показателя коммерческой релевантности R (Q, D, S), которая обозначается (здесь формула).

Затем мы применяем функцию ранжирования от первого шага к полному набору данных с тематической релевантностью. Это возможно, потому что мы используем одну и ту же функцию для ранжирования обоих наборов данных. Поскольку только высоко релевантные результаты получат метку коммерчески релевантных, также метку коммерчески релевантных получат пары «запрос-результат», которые высоко релевантны в масштабе тематической релевантности. Другие пары «запрос-результат» в наборе данных обучения ранжирования получат нулевую оценку коммерческой релевантности.

Имея значения для оценки коммерческой релевантности для всех тематических релевантных результатов по коммерческим запросам, мы можем рассчитать единую релевантность:

где R (q, d) значение тематической релевантности, R (q, d, s) — значение единой релевантности и α весовой коэффициент.

С помощью единого значения релевантности мы ранжируем весь список результатов. Весовой коэффициент α подобран эмпирическим путем, он максимизирует значение коммерческой релевантности, но при этом не касается тематической релевантности. В итоге мы получаем функцию ранжирования, определенную значением единой релевантности, которое включает в себя значения и тематической, и коммерческой релевантности.

4. Особенности оценки качества сайта

Для лучшего определения новых меток релевантности, включающих и тематическую, и коммерческую релевантность, мы введем некоторые критерии, характерные для коммерческих сайтов. Они новые с той точки зрения, что практически бесполезны при определении тематической релевантности, так как метка тематической релевантности не несет в себе никакой информации о коммерческих качествах сайта. Но для аппроксимации новой коммерческой релевантности эти значения очень полезны, так как несут в себе информацию о качестве сайта.

Из многочисленных исследований на эту тему [3, 11, 12] мы выбрали некоторые перспективные возможности и добавили к ним свои. В Таблице 1 приведен список некоторых качественных критериев, используемых в наших исследованиях. Обратите внимание, что большинство из этих функций определяют возможности домена и представляют обобщенную информацию обо всех документах (данных) коммерческого сайта. Это подчеркивает то, что согласно Уравнению 1, коммерческая релевантность зависит от качества сайта. Сравнение результатов ранжирования без применения приведенных критериев приведено в разделе Результаты.

Таблица 1

Подробная контактная информация
Страница компании в социальных сетях
Отсутствие рекламы
Ассортимент продукции
Подробное описание продуктов (услуг)
Наличие службы доставки
Служба поддержки ( электронная почта, телефон, отзывы клиентов)
Он-лайн консультации
Скидки
Читаемое доменное имя
Средняя длина URL
Средняя длина заголовка страницы
Соответствие заголовка страница ее содержанию
Средня глубина пути URL

5. Новые метрики для оценки сайта

Для оценки наших результатов мы разработали две, подобные NDCG, метрики, основанные на мнениях экспертов о качестве коммерческого сайта. Первая метрика представляет собой среднее (взвешенное) качество результатов поиска для конкретного набора коммерческих запросов. Ее (метрики) значение для запроса q определяется:

где Rc (q, di , si ) коммерческая релевантность для первого поискового результата по запросу q. Итоговое значение этой метрики для данного набора запросов среднее значение Goodness(q). среди всех запросов в этом наборе. Чем больше этот показатель, тем лучше результаты поисковой системы.

Вторая наша оффлайновая метрика представляет собой отношение низко качественных результатов к коммерческим запросам. Подобно первой метрики она определяется для всего набора данных как среднее значение зависимых от запроса результатов. Выражение запросо-зависимого значения определяется так:

где th — порог минимально приемлемого значения коммерческой релевантности уместностной для результатов поисковой системы. Чем меньший эта метрика, тем лучшие результаты поисковой системы.

Также мы используем известное A/B тестирования [10] и чередование [4] on-line экспериментов для оценки результатов. Мы уделяем особое внимание уровню отказов и кликов для каждого результата по запросу, а не только клики с длинной выдержкой времени. Мы считаем, что эти показатели являются наиболее ценными для коммерческих запросов.

6. Результаты и мнения

Мы предложили новую оценку результатов поиска по коммерческим запросам — коммерческую релевантность. Мы разработали несколько подходов к оценке качества сайта. Для будущего использования Для сравнения, нами был разработан метод экстрополяции дополнительной метки релевантности для ранжирования всех результатов поиска, что позволило нам не терять тематически релевантные результаты.

Мы разработали оффлайновую, подобную DCG, метрику и следили за ее изменением в ходе эксперимента по добавлению качественной информации в функцию ранжирования. На рисунке 1 показана зависимость Goodness нашей метрики в течение некоторого времени до и после изменения функции ранжирования.

Горизонтальная ось представляет значение времени, а вертикальная ось представляет собой относительное значение нашей метрики.

Рисунок 1. Goodness метрика увеличивается в течение эксперимента.

Видно, что метрика увеличилась почти на 30% по сравнению с начальным значением. Рисунок 2 представляет изменение нашей второй оффлайн метрики — вредность результатах поиска. Опять же, горизонтальная ось представляет значение времени, а вертикальная ось представляет собой относительное значение нашей метрики — некачественные результаты поисковой системы. Как и прежде, горизонтальная ось представляет значение времени, а вертикальная ось представляет собой относительное значение нашей метрики.

Рисунок 2. Некачественность метрики уменьшается в течение эксперимента.

Видно, что некачественность метрически уменьшилась почти на 70%. В то же время, классическая метрики NDCG, рассчитывающаяся только с использование метки тематической релевантности, в течение всего эксперимента осталась практически неизменной.

Мы сравнили наши результаты ранжирования с введением новых критериев коммерческой релевантности с другими результатами ранжирования. В результате видно, что метрика Goodness и метрика Некачественности улучшились на 20% после того, как мы учли новые критерии.

Наши он-лайн эксперименты показали, что пользователи на 1% чаще выбирали результаты нового ранжирования, а не ранжирования по умолчанию. Эксперименты A\B показали, что наше качественно ориентированное ранжирование способствует 5% снижению Отказов и увеличивает количество кликов по каждому запросу на 1,5%.

В будущем, работа включает в себя использование набора меток релевантности вместо одной агрегированной в процессе ранжирования. Другой же путь улучшения результатов поиска по коммерческим результатам будет в разработке новых критериев коммерческого ранжирования.

на Ваш сайт.

toponline.msk.ru


Prostoy-Site | Все права защищены © 2018 | Карта сайта