Ранжирование Яндексом – нужны ли мета-теги? Ранжирование яндекс


Компания Яндекс — Технологии — Ранжирование и машинное обучение

Сейчас уже сложно придумать такой запрос, по которому находится меньше десятка страниц. А по многим запросам результатов поиска — миллионы. И со временем их становится всё больше — интернет очень быстро растет. Поэтому поисковой системе уже недостаточно просто показать все страницы со словами из запроса — чтобы найти подходящий ответ, человеку придется листать десятки страниц с результатами поиска. Поисковая система должна расположить найденные страницы в нужном порядке — так, чтобы сверху оказались наиболее подходящие пользователю (наиболее релевантные). Этот процесс — упорядочивание результатов поиска в соответствии с запросом пользователя — называется ранжированием. Именно ранжирование определяет качество поиска — то есть качество ответа на вопрос, заданный в поисковой строке.

Каждый день Яндекс отвечает на десятки миллионов запросов. Около четверти из них — неповторяющиеся. Поэтому невозможно написать для поисковой системы такую программу, в которой предусмотрен каждый запрос и для каждого запроса известен лучший ответ. Поисковая система должна уметь принимать решения самостоятельно, то есть сама выбирать из миллионов документов тот, который лучше всего отвечает пользователю. Для этого нужно научить ее обучаться.

Задача научить машину обучаться существует не только в поисковых технологиях. Без машинного обучения невозможно, например, распознавать рукописный текст или речь. Термин «машинное обучение» появился еще в 50-х годах. Этот термин обозначает попытку научить компьютер решать задачи, которые легко даются человеку, но формализовать путь их решения сложно. В результате машинного обучения компьютер может демонстрировать поведение, которое в него не было явно заложено.

Поисковая система должна научиться строить правило, которое определяет для каждого запроса, какая страница является хорошим ответом на него, а какая — нет. Для этого поисковая машина анализирует свойства веб-страниц и поисковых запросов. У всех страниц есть какие-то признаки. Некоторые из них — статические — связаны с самой страницей: например, количество ссылок на эту страницу в интернете. Некоторые признаки — динамические — связаны одновременно с запросом и страницей: например, присутствие в тексте страницы слов запроса, их количество и расположение.

У поискового запроса тоже есть свойства, например, геозависимость — это означает, что для хорошего ответа на этот запрос нужно учитывать регион, из которого он был задан. Свойства запроса и страницы, которые важны для ранжирования и которые можно измерить числами, называются факторами ранжирования. Для точного поиска важно учитывать очень много разных факторов.

Кроме факторов ранжирования поисковой системе необходимы образцы — запросы и страницы, которые люди считают подходящими ответами на эти запросы. Оценкой того, насколько та или иная страница подходит для ответа на тот или иной запрос, занимаются специалисты — асессоры. Они берут поисковые запросы и документы, которые поиск находит по этим запросам, и оценивают, насколько хорошо найденный документ отвечает на заданный запрос. Из запросов и хороших ответов составляется обучающая выборка. Она должна содержать самые разные запросы, причём в тех же пропорциях, в которых их задают пользователи. На обучающей выборке поисковая система устанавливает зависимость между страницами, которые асессоры посчитали релевантными запросам, и свойствами этих страниц. После этого она может подобрать оптимальную формулу ранжирования — которая показывает релевантные запросу сайты среди первых результатов поиска.

На примере это выглядит так. Допустим, мы хотим научить машину выбирать самые вкусные яблоки. Асессоры в этом случае получают ящик яблок, пробуют их все и раскладывают на две кучи, вкусные — в одну, невкусные — в другую. Из разных яблок составляется обучающая выборка. Машина пробовать яблоки не может, но она может проанализировать их свойства. Например, какого они размера, какого цвета, сколько сахара содержат, твердые или мягкие, с листиком или без. На обучающей выборке машина учится выбирать самые вкусные яблоки — с оптимальным сочетанием размера, цвета, кислоты и твердости. При этом могут возникать какие-то ошибки. Например, поскольку машина ничего не знает про червяков, среди выбранных яблок могут оказаться червивые. Чтобы ошибок было меньше, нужно учитывать больше признаков яблок.

В поисковых технологиях машинное обучение применяется с начала 2000-х годов. Разные поисковые системы используют разные модели. Одна из проблем, которые возникают при машинном обучении — переобучение. Переобучившаяся машина похожа на студента, который перезанимался — например, прочитал очень много книжек перед экзаменом по психологии. Он мало общается с живыми людьми и пытается объяснить простые поступки слишком сложными моделями поведения. И из-за этого поведение друзей для него всегда неожиданно.

Как это выглядит: когда компьютер оперирует большим количеством факторов (в нашем случае это — признаки страниц и запросов), а размер обучающей выборки (оценок асессоров) не очень велик, компьютер начинает искать и находить несуществующие закономерности. Например, среди всех оцененных страниц могут оказаться две с какой-то сложной комбинацией факторов, например, с размером 2 кб, фоном фиолетового цвета и текстом, который начинается на букву «я». И обе эти страницы окажутся релевантными запросу [яблоко]. Компьютер начнет считать эту случайную комбинацию факторов важным признаком релевантности запросу [яблоко]. При этом все важные документы про яблоки, которые такой комбинацией факторов не обладают, покажутся ему менее релевантными.

Для построения формулы ранжирования Яндекс использует собственный метод машинного обучения — Матрикснет. Он устойчив к переобучению.

yandex.ru

Факторы ранжирование Яндекс | Блог SEO in Site

     Созданный Яндексом алгоритм МатриксНет преподнес нам новые факторы ранжирование, расширив их список и пересчитав их приоритеты. Алгоритм позволил быстро строить более сложную формулу ранжирования. На сегодняшний день это более 420 факторов влияющих на позиции сайта в выдаче. И если раньше можно было поднять сайт в выдаче прокачав от одного до нескольких факторов: наращивание ссылочной массы с необходимыми анкорами количество вхождений в текст было хорошей стратегией для продвижения в топ поисковой выдачи, то сейчас ситуация изменилась в корне и нужен комплексный подход.

   В формуле МатриксНет используются не только базовые, но и комбинированные факторы, так называемые мономы (одночлены). Следовательно, если один из факторов будет иметь низкое значение, то влияние второго фактора с хорошим значением будет нивелировано. Так как произведение нескольких величин (факторов) будут давать низкое значение монома.

Класификация факторов.

 

Факторы значений принимаемых поисковой системой

 

Бинарные значения – принимают значения ноль или единица

Неопределенные значения – принимают разные числовые значения

 

По источнику

 

Внутренние

Текстовые

Свойства документа/сайта

Антиспамовые

Внешние

Статические ссылочные факторы (не зависящие от запроса)

Динамические ссылочные факторы

Поведенческие (пользовательские)

Данные собираются на основе Яндекс ToolBar, Яндекс Метрика, Яндекс Поиск. Если наблюдаются проблемы с поведенческими факторами, не ставьте Яндекс Метрику, не сливайте Яндексу негативную информацию.

Запросные

 

seoinsite.ru

SEO секреты Ранжирование Яндексом – нужны ли мета-теги?

Алгоритм ранжирования Яндекса меняется и его разработчики пытаются найти оптимальные пути улучшения ранжирования. Яндекс постоянно преподносит сюрпризы вебмстерам, после очередных обновлений. Сайты то поднимаются в результатах поиска, то опускаются ниже своих конкурентов, бываю и такое, что вылетают из базы Яндекса вообще, хотя бана при этом не получают. Что стоит изменить в своем SEO и пересмотреть нюанссы продвижения по новому?

Опять Яндекс меняет алгоритмы!?

Анализируя конкурентов и некоторые сайты, можно прийти к выводу, что на самом деле имеет значение для Яндекса при ранжировании сайтов, а что уходит в песочницу. Посмотрите на первые места в ТОП 10 Яндекса по высокочастотным ключевым словам, кто занимает первые позиции? Конечно, Вы не найдете на верхушке ни одного начинающего сайта или личной странички, но зато при поиске по запросу можно получить не совсем верную информацию, которую Вы хотели бы получить от поисковой системы. Это разниться с уставом поисковой системы, который говорит: Что алгоритмы Яндекса направлены только на потребности пользователя и он ранжирует сайты по качеству и ценности информации для пользовательской аудитории.

Тогда можно сказать, насколько совершенны алгоритмы ранжирования Яндекса и что для него имеет значение:

Вот основные факторы ранжирования сайтов Яндексом, все остальное практически не имеет значение. Старый вариант использования мета тегов Description и Keywords утерял свою силу для Яндекса, но отказываться от него совсем не нужно, хотя и придавать большое значение как прежде не стоит.Мета теги в ранжировании сайтов Яндексом все больше перестают играть важную роль и многие вебмастера со временем начинают понимать, что для высокого ранжирования Яндексом, ему нужно скармливать другие ключевые элементы, на которые он обратит свое внимание. Далеко не все понимают, что старые способы SEO устарели, и манипуляция поисковыми системами с помощью ключевых слов абсолютно бесполезна, а порой даже вредна для продвижения сайта. Пользоваться оптимизацией ключевыми словами нужно осторожно, лишь только для того, чтобы обозначить основную направленность информации на странице, а не создавать перенасыщение ключевиками, которое должно повлиять по мнению вебмастера на ранжирование в поиске.

Читать похожие статьи:

seocekret.ru

Ранжирование сайтов — ссылочное, поисковое, поведенческое у Яндекс и Google

Немного  ранее на sitesnulya.ru мы уже рассматривали, что поисковые системы Яндекс и Гугл руководствуются релевантностью сайта при выдаче поисковых результатов на любой запрос пользователя интернета. Но это далеко не все факторы, которые они учитывают. Сегодня мы решили поговорить конкретно об алгоритмах ранжирования, поскольку их обязательно нужно учитывать при популяризации сайта.

Вообще, ранжирование сайта — это и есть то самое определение позиции каждого веб-ресурса на странице выдачи поисковой системы относительного конкретного запроса. Оно имеет несколько видов, в зависимости от факторов, которые имеют наибольшее значение для его подсчета: ссылочное, поисковое, поведенческое, релевантное  и другие.

При этом вы должны понимать, что каждая система имеет свой собственный взгляд, на то, что именно должно учитываться при ранжировании сайтов. Всё это выражается в создании уникальных измерительных показателей, как то: алгоритм pagerank у Гугла или тИЦ и вИЦ у Яндекса.

Ссылочное ранжирование сайтов

Еще несколько лет назад, наличие большого количества внешних (обратных) ссылок на сайт, могло обеспечить ему попадание на первую страницу поисковых результатов, почти по любому запросу. А если нет — нужно было лишь их увеличить. Особенно характерно это было для Яндекса, в то время как Гугл уже тогда начал отказываться от практики превалирования ссылочного ранжирования над другими факторами.

То есть, не важно было содержимое сайтов, как пользователи ведут себя на нем, насколько он отвечает запросам, по которым попадает в топ — главное ссылки.  Продвижения веб-ресурсов было достаточно скучным и зависело только от объема кошелька вебмастера.

Но обилие не релевантных страниц в выдаче, а значит и много негативных отзывов о поисковых системах, привело к тому, что в главная роль в ранжировании перешла к релевантности.

Поисковое ранжирование сайтов

Конечно, никто не отметил важность ссылок,  и они продолжили играть важную роль до последнего времени. Но более важным стало соответствие поисковым запросам пользователей интернета, а значит — необходимо улучшать внутреннюю оптимизацию сайта. Она и раньше играла не последнюю роль.

Как результат таких изменений — поисковые системы стали показывать в выдаче намного более качественные результаты и процент страниц, которые действительно релевантные запросам значительно повысился.

Но, авторитетность сайта и количество ссылок на него, всё также продолжали играть важную роль в ранжировании, из-за чего многие вебмастеры предпочитали не утруждаться особо с внутренней оптимизацией, а лишь дальше закупали внешние линки.

Гугл — это мировой лидер поиска, а потому чуть раньше начал вносить коррективы свои методы ранжирования, всё меньше уделяя внимания pagerank сайтов, а год назад и вовсе объявил, что не будет его обновлять. То есть новые сайты не смогут изменить значение пейдж ранка с 0 на более высокое.

Яндекс же учитывает реалии рунета, а потому несколько позже начал борьбу с покупными ссылками. Результатом этого стал печально известный фильтр Минусинкс, который вступил в силу в апреле 2015 года. Подробнее о нем мы напишем позже, но скажем только дно — очень многие сайты пострадали в выдаче из-за обилия покупных внешних ссылок.

Поведенческое ранжирование сайтов

На сегодняшний день, средину августа 2015 года, обе самые популярные системы поиска в нашей части интернета Яндекс и Google, переносят свое повышенное внимание на такой фактор ранжирования сайтов, как — поведенческие факторы.

Конечно, все другие критерии продолжают играть важную роль при определении позиции сайта в результатах поиска. Никто и никогда не отменит необходимость учитывать релевантность поисковому запросу.

Но, некоторые аналитики начали поговаривать, что Яндекс отменил ссылочное ранжирование.  Мы думаем, что это преждевременное заявление. тИЦ и вИЦ всё также важны для любого сайта.

Так вот, поведенческие факторы ранжирования — это то, как себя ведут пользователи интернета на вашем сайте. Здесь учитывается абсолютно всё — сколько времени они пребывают на каждой странице, число отказов  (закрытие сайта сразу после перехода на него), число переходов внутри сайта, на какие элементы меню они чаще всего нажимают и много чего еще, о чем нам поисковые системы не сообщают прямо.

Наиболее важное, что мы все должны из этого уяснить — что наша задача задержать внимание посетителя сайта как можно дольше, а еще лучше, если он будет переходить между страницами.

Это добивается внутренней оптимизацией, отличным дизайном сайта, интересным и уникальным контентом.

Что же касается новых сайтов, которые вы только создаете и пытаетесь раскрутить, то нынешняя ориентация поисковых систем на поведенческие факторы не очень хорошо сказывает на них. Зачастую это связано с тем, что новые проекты редко бывают в самом начале своего существования уже полностью оптимизированы внутренне и внешне, а потому случайный посетитель редко задерживается и ухудшает поведенческие характеристики сайта.

Советуем сначала максимально наполнить и оптимизировать свой проект, а только потом начинать его популяризацию.

 

Также стоит прочитать

sitesnulya.ru

ответы на вопросы — Блог Яндекса для вебмастеров

Пост в архиве.

6 декабря 2013, 11:12

Вчера на конференции IBC Russia 2013 мы рассказали о том, что в следующем году перестанем учитывать ссылки в ранжировании по коммерческим запросам. Это сообщение вызвало много вопросов, и мы хотим ответить на самые частые из них.

1. С чем связано решение отказаться от учёта ссылок при ранжировании?

Из каждого вида данных мы пытаемся извлечь сигнал, который помогает отделить релевантный ответ от нерелевантного. Когда источник данных сильно зашумлён из-за спама, сигнал теряется, и данные становятся бесполезны. Особенно на фоне других факторов, которых в поиске Яндекса сейчас около 800.

Именно это произошло с сегментом коммерческих ссылок: они во многом утратили своё значение как сигнал для определения релевантности и превратились в шум. Качество сайтов с ростом количества купленных ссылок тоже не улучшается. Поэтому мы решили больше не учитывать ссылки при ранжировании по коммерческим запросам — для начала только по запросам из московского региона. Мы уже провели эксперименты и увидели, что после отказа от учёта ссылок качество поиска не ухудшается.

2. Коснётся ли это нововведение других категорий запросов и регионов?

Сейчас речь идёт только о коммерческих запросах пользователей из московского региона, о дальнейшем развитии событий говорить пока рано.

3. Правильно ли мы понимаем, что вы хотите таким образом «убить» рынок чёрного SEO?

Мы заботимся прежде всего о качестве поиска и боремся с влиянием чёрной оптимизации ровно в той мере, в какой она мешает нам давать пользователям релевантные ответы. В последние несколько лет вес ссылок в ранжировании постоянно снижался. Мы говорили об этом и на конференциях, и в интервью. Называли даже долю ссылочных факторов в топ-10 факторов. Эта тенденция была очевидна. Поэтому нет никакого «убийства». Есть закономерное постепенное отмирание неэффективного для продвижения в Яндексе инструмента, которое, наконец, все заметили.

4. На чём будет основан новый алгоритм ранжирования по коммерческим запросам?

Он будет опираться на остальные факторы ранжирования – сейчас их около 800. Подробности об алгоритме мы, возможно, расскажем при запуске. Пока говорить об этом рано.

5. Как этот запуск отразится на SEO-индустрии?

Мы надеемся, что он будет способствовать переориентации рынка с махровой оптимизации в сторону цивилизованного интернет-маркетинга. Появится запрос на услуги по улучшению юзабилити, повышению конверсии посетителей в покупателей и так далее.

Команда поиска

webmaster.yandex.ru


Prostoy-Site | Все права защищены © 2018 | Карта сайта