Содержание
Требования к обработке заказов и доставке
С января 2022 предложения продавцов из России не показываются на десктопной и мобильной версиях Маркета. При этом предложения продолжают показываться покупателям в Яндекс Советнике.
Продавайте ваши товары на маркетплейсе Яндекс Маркета
Стать продавцом
- Обработка заказа
- Доставка и самовывоз
- Способы оплаты
- Изменение заказа
- Отмена заказа
При размещении на Маркете по модели DBS (продажи с доставкой магазина) магазин должен выполнять требования к срокам и порядку обработки заказов. О том, как работать с заказами, вы можете прочитать в разделе Обработка заказа.
Своевременно передавайте статусы заказа, как описано в инструкциях, чтобы Маркет мог консультировать покупателей и следить за качеством обработки заказов. Иначе магазин может быть отключен от Маркета.
Следите за остатками товаров на своих складах и не допускайте отмен заказов из-за недостачи. Иначе магазин может быть отключен от Маркета. Если товар закончился, его нужно скрыть с Маркета. Если у вас несколько складов в личном кабинете, остатки товаров необходимо передавать отдельно по каждому складу.
При обработке заказов через личный кабинет после получения заказа у вас есть 2 часа, чтобы принять или отменить его. При обработке заказа через API Маркет будет отправлять запросы POST /order/accept, пока вы не ответите на один из них подтверждением заказа (
"accepted": true
) или отменой ("accepted": false
).При оформлении заказа покупатель может указать регион, который будет отличаться от выбранного ранее на Маркете. В запросе POST/cart Маркет передаст информацию с регионом, указанным покупателем в заказе. В ответ на запрос вам нужно:
либо передать актуальные параметры доставки для указанного региона. В этом случае покупатель сможет оформить заказ;
либо сообщить покупателю, что доставка в выбранный регион не осуществляется. Для этого нужно передать для параметра
delivery
, вложенного вitems
, значениеfalse
или отправить параметрdeliveryOptions
пустым.
Стоимость доставки по городу может отличаться для разных его частей. Например, в Москве доставка за МКАД часто дороже доставки по центру. В этом случае вы можете уточнить стоимость доставки. В запросе POST /cart Маркет передает вам информацию об адресе доставки. Рассчитайте стоимость доставки до переданного адреса и отправьте ее в ответе на запрос, в параметре
deliveryOptions.price
.После получения и сборки заказа вам нужно передать его в доставку. Для этого с помощью запроса PUT /campaigns/{campaignId}/orders/{orderId}/status отправьте
"status": "DELIVERY"
. Мы рекомендуем передавать заказ в доставку:для домашнего региона — не позднее начала дня даты доставки;
при отправке в другой регион — не позднее 2 дней до даты доставки.
Доставить заказ нужно в дату, указанную в заказе. После доставки передайте
"status": "DELIVERED"
. Если нужный статус не был передан вовремя, это отразится на индексе качества.
Если вы по каким-либо причинам сомневаетесь в подлинности заказа (например, предполагаете, что он оформлен из недобросовестных побуждений), Маркет может проверить такой заказ. Для этого отправьте заявку через форму обратной связи. В заявке подробно опишите, почему вы посчитали заказ недействительным.
В случае частых необоснованных обращений Маркет может приостановить прием заявок на проверку заказов.
Отправить запрос
При доставке из одного региона в другой должны выдерживаться заявленные сроки доставки. Они могут быть скорректированы с учетом времени, когда был сделан заказ, или расписания работы курьерской службы.
Подъем заказа на этаж и доставка до двери покупателя должны быть включены в стоимость заказа.
Минимальный срок хранения заказа при самовывозе — не менее 2 рабочих дней.
При подтверждении заказа по API необходимо передавать в параметрах
fromDate
иtoDate
самую раннюю и самую позднюю возможные даты доставки соответственно, а в параметреintervals
— даты и интервалы доставки (для курьерской доставки при возможности). Подробнее см. в документации.
Магазин должен принимать заказы с оплатой при оформлении или получении. Конкретные способы оплаты, доступные пользователю, Маркет определяет самостоятельно.
Если пользователь оформил заказ с оплатой при получении, вы должны предоставить ему возможность расплатиться наличными.
Для безрецептурных лекарств доступна предоплата, только если вы настроили курьерскую доставку. При самовывозе лекарств и БАДов доступна только оплата при получении заказа.
Указать в настройках собственные способы оплаты при оформлении и получении заказа нельзя.
После подтверждения заказа вы можете изменить только дату его доставки. Если пользователя не устроит новая дата, он может отменить заказ.
Нельзя изменить без отмены заказа:
Заказ может быть отменен с причиной:
USER_CHANGED_MIND
— только по инициативе покупателя (например, если покупатель отказался от заказа по телефону).USER_UNREACHABLE
— не удалось дозвониться до покупателя.PICKUP_EXPIRED
— заказ прибыл в пункт выдачи, но в течение нескольких дней покупатель его не забрал. В итоге истек срок хранения заказа.SHOP_FAILED
— в остальных случаях. Например, товара нет в наличии, вы не можете продать его по заявленной цене или покупателя не устраивают сроки доставки при ее задержке.
Если магазин будет передавать некорректные статусы, он может быть отключен.
Подробнее об отмене заказов.
Влияние типов страниц на ранжирование в Яндексе – статьи про интернет-маркетинг
Последнее обновление: 02 октября 2019 года
9078
У всех была такая ситуация: мы долго занимаемся SEO, исправили все технические ошибки, закупаем ссылки, работаем с семантикой, пишем тексты… У нас отличное УТП, мы предлагаем услугу, которая выделяется на рынке. Казалось бы, делаем все правильно, но при этом сидим в ТОП-20-30-50-100, трафика нет, позиции не очень. Почему так? Забыли важную вещь — соблюдение типов страниц.
Мы провели детальное исследование влияния типов страниц на ранжирование в Яндексе. Безусловно, есть какая-то зависимость и в Google, но так как большая часть данных обрабатывалась вручную, мы пока сосредоточились на одной поисковой системе.
Детали эксперимента
Есть много типов и подтипов пары «запрос-документ». Запросы могут быть коммерческие/информационные, геозависимые/геонезависимые, витальные/невитальные и т.д. По ним в поиске находятся листинги, карточки товара, карточки услуги, отзывы, обзоры, видео, инструкции, PDF-файлы, калькуляторы и т.д. Отдельно страниц и отдельно запросов нет — всегда рассматривается связка запроса и страницы.
С помощью машинного обучения и данных статистики поисковик определяет, какие типы страниц показывать в выдаче. Если человека интересует конкретное предложение по товару, ему как потребителю наплевать на оптимизацию: его не волнует, как у вас проработана семантика и сколько ссылок вы купили. Он хочет видеть в поиске конкретный результат. Задача поисковика — определить, на какие типы страниц направить пользователя и что конкретно показать в выдаче. Поэтому он на какие-то запросы показывает листинги, а на какие-то — карточки товара.
Для всех оптимизаторов очевидно, что даже с самой крутой статьей или обзором не получится попасть в коммерческую выдачу. Но также сложно продвинуть карточку товара в коммерческую выдачу с листингами. Бывает так, что интернет-магазин продвигал карточки товаров — не получилось. Затем начинали делать листинги. С перемешанным типом страниц задача остается тяжелой, но не является невыполнимой.
Мы решили выяснить, насколько совпадение типов страниц на сайте с типами страниц в выдаче на самом деле влияет на позиции. Для этого взяли 50 сайтов разных тематик из 20 регионов и собрали 2000 кластеров запросов. В результате получилось 13200 запросов в ТОП-10 и 6800 запросов в ТОП-20+. Итого примерно 20000 страниц поисковой выдачи.
Анализ поисковой выдачи
Есть два типа выдачи: сформированная и несформированная.
В сформированную выдачу можно попасть только с подходящим типом документа. Здесь очень высокая конкуренция, поэтому если в поисковой выдаче по продвигаемым запросам только карточки товара, следует продвигать именно их, а не страницы каталогов или обзоры.
В несформированной выдаче (как правило, по непопулярным и брендовым запросам) конкуренция низкая, поэтому туда можно попасть с любым типом страниц.
Наша задача в рамках этого исследования — оценить вручную 10000 страниц сформированной выдачи и 10000 несформированной. На это ушло много времени, несмотря на то, что мы анализировали только запросы с частотностью больше 10.
Все знают, что такое «кластеризация по топам» — когда запросы сравниваются по количеству одинаковых URL-ов в ТОП-10. Это может быть soft-кластеризация, hard-кластеризация или смешанный тип. Этот же принцип мы использовали для оценки типов страниц:
- если с нашей страницей совпадает по типу 5 и более страниц в выдаче — «точно совпадает»;
-
если совпадает хотя бы 3 страницы — «возможно»; -
если меньше 3 страниц — «не совпадает».
Например, мы продвигаем карточку товара. Если мы в выдаче видим 5 сайтов с карточками товара, значит, мы с ними совпадаем. Если в выдаче только у трех страниц карточка товара, то возможно совпадаем. Если же в выдаче меньше трех страниц, то точно не совпадаем.
Сформированная выдача
Пример сформированной выдачи по коммерческому запросуПример сформированной выдачи по информационному запросу
Все результаты выдачи, которые оценивали, мы разбили на 3 группы. В них одинаковое количество запросов, одинаковый средний показатель Wordstat и одинаковое отклонение по Wordstat.
Получили следующие данные:
- если типы страниц совпадают в выдаче, то 35% высокочастотных запросов находятся в ТОП-10, среднечастотных — 48%, низкочастотных — 66%;
-
если совпадают хотя бы три страницы, то 32%, 46% и 58% соответственно; -
если совпадает менее трех страниц, то высокочастотных запросов всего 9%.
Соответственно, для высоко и среднечастотных запросов важно совпадение типов страниц.
При этом тип запросов — коммерческие или информационные — не имеет значения, разница минимальна.
Смотрим тематики, где типы страниц совпадают с выдачей: мы проверили интернет-магазины, туры, авто, финансы, недвижимость. Видим, что тематика не важна.
По регионам разница есть: в небольших городах даже при совпадении меньше трех в ТОП-10 около 32% запросов.
Как это выглядит на практике. Есть листинг — фото слева. Этот листинг находится в ТОП-1, и в 6 из 10 случаев в выдаче тоже листинги. А вот справа карточка товара, она в ТОП-24. В выдаче всего 1 совпадение.
Несформированная выдача
Чаще всего несформированная выдача бывает в низкоконкурентных, низкочастотных темах, где поисковик еще не имеет достаточно статистических данных, чтобы понять, какие типы страниц нужны пользователю. Поэтому в несформированную выдачу можно попасть с любым типом документа; позиции и видимость сайта зависят от уровня оптимизации.
Если несформированная выдача оказалась по какому-то высококонкурентному запросу, вероятнее всего, сейчас он проходит тест, и поисковик пока еще не определил, что лучше показывать. В такую выдачу можно продвигать те страницы, которые больше подходят для вашего сайта.
Пример несформированной выдачи по коммерческому запросуПример несформированной выдачи по информационному запросу
Для совпадающих типов страниц данных нет. Если совпадают хотя бы три страницы, в ТОП-10 среднечастотных запросов 25%, низкочастотных — 63%. Если совпадают меньше трех страниц, высокочастотных — меньше 1%, среднечастотных — 22%, низкочастотных — 62%.
Это относится ко всем типам страниц: «коммерция» и «инфо» — разницы нет.
Также не важна тематика.
Процесс типизации страниц
К сожалению, из-за сложной реализации специального сервиса для типизации страниц нет. Поэтому приходится делать все вручную: самому определять типы в выдаче и свои типы, затем — переделывать страницы.
Анализ выдачи — это долго и нудно, поэтому стоит его проводить, когда у проекта уже хорошие позиции и нужно что-то «дотолкать до ТОПа». Мы пересматриваем семантику и выбираем запросы, которые находятся на 10-30 позиции. Выбираем запросы, анализируем, почему они не в ТОПе, и смотрим выдачу.
Если тип страниц не совпадает, нужно его изменить. Но возникает трудность. Например, мы продвигаем интернет-магазин, и нам нужно пересадить запрос с карточки товара на релевантный листинг. Что делать с карточкой? В идеале — убрать. Но чаще всего заказчик не позволяет закрыть от индексации страницу и снять с нее текст. Тогда мы стараемся искать другое решение.
Показательный пример — запросы «пластиковые окна цена» и «пластиковые окна купить». По «пластиковые окна цена» в Яндексе покажутся только главные страницы, по «пластиковые окна купить» — внутренние, например, с прайсами. По смыслу запросы одинаковые. Получается, что необходимо создать две разные страницы, чтобы попасть в выдачу. С точки зрения SEO все просто: делаем 2 страницы, чтобы собрать трафик и там, и там. Но с точки зрения юзабилити создавать несколько одинаковых по смыслу страниц неправильно.
Мы рекомендуем проводить типизацию на стадии on-page оптимизации в борьбе за высокочастотные запросы и высококонкурентные позиции. Другими словами, когда сайт уже продвинут, и его нужно точечно доработать.
Также можно делать типизацию страниц на этапе проектирования сайта. Когда страниц много и каждую проверить невозможно, нужно определить тип для основных страниц, где бывают точки роста — категории какие-то, возможно карточки популярных товаров.
Статья
Кейс «Горторгснаб» — увеличили видимость сайта, число запросов и трафик
#SEO, #Яндекс
Статья
Карты Яндекса и Google: советы, ошибки и влияние на репутацию
#SEO, #Optimization
Статья
Путь покупателя в e-commerce
#SEO, #Optimization
Выводы
Как показывают данные, достижение ТОПа в большинстве случаев возможно только при совпадении типа страниц с теми, которые находятся в ТОПе.
Большая семантика ничего не значит, если у вас нет нужного типа страниц для ее распределения. Иногда бывает так: интернет-магазины собирают большое семантическое ядро и создают страницы, пытаясь охватить весь возможный ассортимент и категории. А потом оказывается, что для половины запросов, которые есть в семантике, в поиске ранжируется тип страниц «листинг» или тип страниц «карточка товара», а у магазина — страницы другого типа. Они делают оптимизацию, закупают ссылки, но позиции не растут. Причина простая — несоответствие типа страниц.
Данные исследования мы используем в работе над своими проектами. Если сайт в ТОПе, но несколько запросов не продвигаются, вероятно именно несовпадение типов страниц. Мы проводим ручную оптимизацию: анализируем поисковую выдачу, оцениваем типы и начинаем внедрять. Иногда этого достаточно. Для уже продвигаемых проектов это работает хорошо. Практический результат для сайтов, которые только пришли на продвижение, оценить сложно, потому что проводятся и другие работы.
Материал подготовила Анна Акулова
Теги:
SEO, Optimization, поисковые системы, ранжирование, стратегия продвижения, Яндекс
Советы по поисковому маркетингу для Яндекса, ведущей поисковой системы России
Поисковая система » SEO » Советы по поисковому маркетингу для Яндекса, ведущей поисковой системы России играет вторую скрипку после Яндекса, который в настоящее время является основной поисковой системой в России с более чем половиной доли рынка.
Яндекс получает сотни миллионов долларов дохода и предоставляет широкий спектр онлайн-услуг (электронная почта, бесплатный хостинг, рекламная сеть с оплатой за клик (Яндекс Директ), карты, новости, погода и словари). Comscore поставил веб-ресурс на первое место в России с 34,9 баллами.миллионов уникальных посетителей в августе 2010 года. Это также 25-й сайт в Alexa Top 100. Более того, Яндекс является поисковой системой по умолчанию в русской версии Firefox.
Русский язык в связи с SEO
Если ваша компания обращает внимание на российский рынок, вы можете подумать о создании русскоязычной версии своего веб-сайта, чтобы привлечь больше местных клиентов. Вы могли бы построить свою стратегию SEO, основываясь на своем опыте работы в англоязычном Интернете, но если вы создаете контент на русском языке, вам следует знать некоторые основные факты об этом языке, которые могут повлиять на ваши стратегии SEO.
Самый важный из славянских языков и пятый по распространенности в мире, русский язык используют 275 миллионов человек во всем мире. Это довольно много, и ваша SEO-кампания должна быть ориентирована только на вашу целевую аудиторию.
Более того, русский язык довольно сложный, с различными грамматическими явлениями, которые нужно осмыслить. Так что иметь русскоговорящего специалиста в своей SEO-команде или отдать эту услугу на аутсорсинг — хорошее решение.
Факторы ранжирования Яндекса
Яндекс был разработан для обработки семантики языковой системы страны. Имеет собственный алгоритм индексации и ранжирования сайтов под названием Снежинск. Этот алгоритм основан на более чем 1000 факторах ранжирования, наиболее важными из которых являются возраст, уникальный контент и качественные обратные ссылки.
Цитата/индекс цитирования
Подобно Google PageRank, Яндекс использует собственную метрику – индекс цитаты (индекс цитируемости) – для обозначения надежности сайта, в диапазоне от 0 до 150 000. Надежные непубличные сайты в Яндексе имеют значения от 150 до 1000, а лидеры каталога Яндекса в медиасекторе имеют значения до 20 000. В целом, чем выше индекс котировок, тем прочнее ваши позиции на русскоязычной площадке.
Индекс цитаты определяется количеством и качеством обратных ссылок вашего сайта, при этом качество зависит от релевантности контекста, географического положения ссылающегося сайта и Индекса цитаты ваших входящих ссылок.
Геотаргетинг
География — очень важный фактор для Яндекса. Все запросы, вводимые пользователями в поле поиска, делятся на геозависимые и геонезависимые.
Например, если кто-то будет искать в Яндексе [парикмахерская] (геозависимое ключевое слово) с московским IP, результаты будут только для этого региона. Напротив, общий запрос, например [скачать фильмы], покажет результаты из разных регионов.
Яндекс определяет геозависимость статистически. Например, запрос [грузоперевозки] является геозависимым, так как по статистике часто сопровождается определенной локацией. До 30 процентов всех запросов в Яндексе геозависимы.
Как проверить регион вашего сайта в Яндексе
Яндекс автоматически присвоит каждому проиндексированному сайту географическое положение в соответствии с данными о местоположении по IP, доменным именем, контактной информацией (почтовый индекс, номер телефона) и содержание в целом.
В настоящее время Яндекс поддерживает 19 регионов и 1250 более мелких населенных пунктов — городов и поселков. Вы можете проверить, к какому региону относится ваш сайт, в разделе Яндекс Вебмастер (сервис доступен только на русском языке).
Как проверить позиции вашего сайта в регионах Яндекса
Вы можете вручную сравнить рейтинг вашего сайта по тому или иному ключевому слову в разных регионах с помощью расширенного поиска Яндекса. Введите целевое местоположение в поле региона, просмотрите поисковую выдачу и найдите позицию своего сайта. Сначала выберите расширенный поиск:
Затем введите запрос и регион.
В Яндекс Вебмастере также есть функция сравнения регионов (требуется регистрация). Это позволяет сопоставлять результаты в двух разных регионах на одной странице. Достаточно удобная, эта функция имеет существенный недостаток. В списке всего шесть огромных регионов: Москва, Санкт-Петербург, Россия, Беларусь, Казахстан и Украина.
Если вы хотите, чтобы сравнение регионов выполнялось быстрее, вы можете использовать наш бесплатный инструмент. Позволяет проверить позиции вашего сайта сразу в нескольких (или во всех) регионах Яндекса; он также позволяет работать с ключевыми словами на русском языке при использовании английского интерфейса.
Назад к геотаргетингу — как только Яндекс просканирует ваш сайт, ему будет присвоен определенный регион. Если у вас все в порядке с регионом, который был присвоен вашему сайту — вам повезло! Но иногда Яндекс ошибается, и тогда вам может быть трудно попасть в рейтинг в нужном вам регионе.
Что делать, если вашему сайту был присвоен неправильный регион?
В этом случае необходимо запросить смену региона у Яндекс Вебмастера, указав предпочитаемый регион и предоставив URL, подтверждающий соответствие этому региону.
Если у вас есть офис в России, вы можете указать его контактную информацию, чтобы подтвердить, что вы ведете там бизнес.
Что делать, если ваш сайт должен быть связан с несколькими регионами?
Вы можете выбрать до 7 регионов, если ваш сайт включен в каталог Яндекса (например, DMOZ и Yahoo Directory). Размещение там повысит ваш индекс котировок и привлечет посетителей.
В Яндекс Каталоге есть два типа объявлений: бесплатные и платные (видимо, платные повышают шансы на попадание). Вы можете получить платный листинг в течение нескольких дней. Однако сайт может быть отклонен из-за плохого качества. Редакторы Яндекс Каталога строгие! Бесплатные листинги — это вопрос удачи. Можно подать заявку и ждать несколько месяцев.
Что делать, если вы не хотите ассоциироваться ни с одним регионом?
Если вам не нужны региональные привязки, в Яндекс Вебмастере есть такая возможность.
Яндекс Директ: Опции контекстной рекламы
Очевидно, что для оптимизации русскоязычной версии вашего сайта в Яндексе потребуется составить эффективный список ключевых слов. При создании списков ключевых слов для своих американских, немецких или французских сайтов вы обращаетесь к Google и Bing за предложениями по ключевым словам. Но что вы делаете в России?
У Яндекса есть собственная служба контекстной рекламы под названием Яндекс Директ, похожая на Google AdWords и AdCenter от Bing. Yandex PPC поддерживает функции фразового и точного соответствия.
Яндекс Директ управляет кампаниями PPC, показывая рекламу на основе цены за клик. Вы сами решаете, сколько платить за клик. Минимальная ставка 30 копеек (около цента), а минимальный заказ 300 рублей (около 10 баксов).
Указание регионов для ваших объявлений, вероятно, повысит общую эффективность вашей рекламной кампании. Вы можете выбрать несколько географических регионов или один, в котором вы хотите, чтобы ваше объявление отображалось.
Вы можете проверить расчетный объем поиска по любым ключевым словам/фразам в любом регионе с помощью Яндекс Вордстат. Он предоставляет предложения по ключевым словам вместе с ежемесячными объемами поиска. К сожалению, вы можете ввести только одно начальное ключевое слово за раз, поэтому процесс создания списка ключевых слов займет некоторое время.
Недавно Яндекс выпустил подробный отчет о контекстной рекламе в России. Отчет охватывает три года, с лета 2007 г. по лето 2010 г. За первые шесть месяцев 2010 г. рыночная доля Яндекс Директ оценивалась в 75-80%. По состоянию на лето 2010 года рекламу, размещенную на сайтах через Яндекс Директ, просматривали более 21 млн пользователей в день. Самый быстрый рост наблюдается в регионах России, намного выше, чем в Москве и Санкт-Петербурге.
Как видите, Яндекс развивается и создает прекрасные возможности для проведения региональных кампаний для международных компаний в России и странах бывшего Советского Союза. Все еще находите SEO в России сложным? Поверьте, это стоит попробовать!
Мнения, высказанные в этой статье, принадлежат приглашенному автору и не обязательно принадлежат Search Engine Land. Штатные авторы перечислены здесь.
Добавьте Search Engine Land в свою ленту новостей Google.
Похожие истории
Новое на сайте Search Engine Land
Об авторе
Яндекс Поиск — Wiki | Golden
О компании
Технология поиска обеспечивает результаты локального поиска в более чем 1400 городах. В поиске Яндекса также реализован «параллельный» поиск, который представляет на одной странице результаты как основного веб-индекса, так и специализированных информационных ресурсов, включая новости, покупки, блоги, изображения и видео.
Поиск Яндекса реагирует на запросы в режиме реального времени, распознавая, когда запросу требуется самая актуальная информация, например, последние новости или самая свежая запись в Твиттере по определенной теме. Он также содержит некоторые дополнительные функции: Wizard Answer, который предоставляет дополнительную информацию (например, спортивные результаты), проверку орфографии, автозаполнение, которое предлагает запросы по мере их ввода, антивирус, который обнаруживает вредоносные программы на веб-страницах и так далее.
В мае 2010 года Яндекс запустил Yandex.com, платформу для бета-тестирования и улучшения поиска на других языках.
Доступ к продукту поиска возможен с персональных компьютеров, мобильных телефонов, планшетов и других цифровых устройств. Помимо веб-поиска, Яндекс предоставляет широкий спектр специализированных поисковых сервисов.
В 2009 году Яндекс запустил MatrixNet — новый метод машинного обучения, значительно повышающий релевантность результатов поиска. Это позволяет поисковой системе Яндекса учитывать очень большое количество факторов при принятии решения о релевантности результатов поиска.
Еще одна технология, Spectrum, была запущена в 2010 году. Она позволяет выводить неявные запросы и возвращать соответствующие результаты поиска. Система автоматически анализирует поисковые запросы пользователей и идентифицирует такие объекты, как личные имена, фильмы или автомобили. Доли результатов поиска, отвечающих различным намерениям пользователей, основаны на спросе пользователей на эти результаты.
С первым выпуском 21 июля 2017 года веб-браузер Brave включает Яндекс в качестве одной из поисковых систем по умолчанию.
Функциональность
Базовая информация
Поисковая система состоит из трех основных компонентов:
- Агент – это поисковый робот. Обходит сеть, скачивает и анализирует документы. Если при анализе сайта обнаруживается новая ссылка, она попадает в список веб-адресов робота. Поисковые роботы бывают следующих видов: пауки – загружают сайты наподобие браузеров пользователя; Crawler — находите новые, еще неизвестные ссылки на основе анализа уже известных документов; индексаторы — анализируют обнаруженные веб-страницы и добавляют данные в индекс. Многие сдутые документы разбиваются на непересекающиеся части и очищаются от разметки.
- Index — это база данных, составленная роботами-индексаторами поисковых систем. Документы ищутся в индексе.
- Поисковик. Поисковый запрос от пользователя отправляется на наименее загруженный сервер после анализа загрузки поисковой системы. Для предоставления такой возможности серверы Яндекса кластеризуются. Затем запрос пользователя обрабатывается программой «Метапоиск». Метапоиск анализирует запрос в режиме реального времени: определяет географическое положение пользователя, проводит лингвистический анализ и т. д. Также программа определяет, относится ли запрос к категории самых популярных или недавно определенных. Выдача таких запросов в течение некоторого времени хранится в памяти (кеше) метапоиска, и в случае совпадения выводятся ранее сохраненные результаты. Если запрос редкий и совпадений в кеше нет, система перенаправляет его в программу Базовый поиск. Он анализирует системный индекс, который также разбит на разные серверы-дубликаты (это ускоряет процедуру). Затем полученная информация снова попадает в метапоиск, данные ранжируются и показываются пользователю в окончательном виде.
Индексирование
В основном Яндекс индексирует следующие типы файлов: html, pdf, rtf, doc, xls, ppt, docx, odt, odp, ods, odg, xlsx, pptx.
Поисковая система также способна индексировать текст внутри объектов Shockwave Flash (если текст не размещен на самом изображении), если эти элементы передаются как отдельная страница, имеющая MIME-тип application/x-shockwave-flash , и файлы с расширением . swf
В Яндексе есть 2 сканирующих робота — «основной» и «быстрый». Первый отвечает за весь Интернет, второй индексирует сайты с часто меняющейся и обновляющейся информацией (новостные сайты и информационные агентства). В 2010 году «быстрый» робот получил новую технологию под названием «Апельсин», разработанную совместно калифорнийским и московским подразделениями Яндекса.
С 2009 года Яндекс поддерживает технологию Sitemaps.
Журналы сервера
В логах сервера роботы Яндекса представлены следующим образом:
Mozilla/5.0 (совместимый; YandexBot/3.0) — основной индексирующий робот.
Mozilla/5.0 (совместимый; YandexBot/3.0; MirrorDetector) — робот, определяющий зеркала сайтов. Если сайтов с одинаковым контентом несколько, в результатах поиска будет показан только один.
Mozilla/5.0 (совместимый; YandexImages/3. 0) — индексатор Яндекс. Картинки.
Mozilla/5.0 (совместимый; ЯндексВидео/3.0) — индексатор Яндекс. Видео.
Mozilla/5.0 (совместимый; YandexMedia/3.0) — индексатор мультимедийных данных.
Mozilla/5.0 (совместимый; ЯндексБлоги/0.99; робот) — поисковый робот, индексирующий комментарии к публикациям.
Mozilla/5.0 (совместимый; YandexAddurl/2.0) — поисковый робот, который индексирует страницы через форму «Добавить URL».
Mozilla/5.0 (совместимый; ЯндексДирект/2.0; Дятел) — проверка Яндекс. Прямой.
Mozilla/5.0 (совместимый; ЯндексМетрика/2.0) — индексатор Яндекс. Метрики.
Mozilla/5.0 (совместимый; ЯндексКаталог/3.0; Дятел) — проверка Яндекс. Каталог.
Mozilla/5.0 (совместимый; ЯндексНовости/3.0) — индексатор Яндекс. Новости.
Mozilla/5.0 (совместимый; ЯндексАнтивирус/2.0) — антивирусный робот Яндекса.
Язык запроса
Для настройки используются следующие операторы:
«» — точная цитата
| — вводить между словами, если нужно найти одно из них
* — вводить между словами, если пропущено какое-то слово
сайт: — поиск по конкретному сайту
дата: — поиск документов по дате, например date: 2007
+ — ввод перед словом, которое должно быть в документе
Результаты поиска
Яндекс, автоматически, наряду с исходной «точной формой» запроса, ищет различные его вариации и формулировки.
Поиск Яндекса учитывает морфологию русского языка, поэтому вне зависимости от формы слова в поисковом запросе поиск будет производиться по всем словоформам. Если морфологический анализ нежелателен, перед словом можно поставить восклицательный знак (!) — поиск в этом случае покажет только конкретную форму слова. Кроме того, поисковый запрос практически не учитывает так называемые стоп-слова, то есть предлоги, знаки препинания, местоимения и т. д., в силу их широкого распространения
Как правило, сокращения автоматически раскрываются, орфография исправляется. Он также ищет синонимы (мобильный — сотовый). Расширение исходного пользовательского запроса зависит от контекста. Расширения не происходит при наборе узкоспециализированных терминов, наименований собственных имен компаний (например, ОАО «Бегемот» — ОАО «Бегемот»), добавления слова «цена», в точных кавычках (это запросы, выделенные машинописным цитаты).
Результаты поиска для каждого пользователя формируются индивидуально с учетом его местонахождения, языка запроса, интересов и предпочтений по результатам предыдущих и текущих поисковых сессий. Однако ключевым фактором ранжирования результатов поиска является их релевантность поисковому запросу. Релевантность определяется на основе формулы ранжирования, которая постоянно обновляется на основе алгоритмов машинного обучения.
Поиск осуществляется на русском, английском, французском, немецком, украинском, белорусском, татарском, казахском языках.
Результаты поиска можно сортировать по релевантности и дате (кнопки под результатами поиска).
Страница с результатами поиска состоит из 10 ссылок с короткими аннотациями – «фрагментами». В сниппеты входит текстовый комментарий, ссылка, адрес, популярные разделы сайта, страницы в социальных сетях и т. д. В качестве альтернативы сниппетам Яндекс в 2014 году представил новый интерфейс под названием «Острова».
Яндекс реализует механизм «параллельных поисков», когда вместе с веб-поиском выполняется поиск по сервисам Яндекса, таким как Каталог, Новости, Маркет, Энциклопедии, Картинки и т. д. В результате в ответ на запрос пользователя , система показывает не только текстовую информацию, но и ссылки на видеофайлы, картинки, словарные статьи и т.д.
Отличительной чертой поисковой системы также является технология «поиска по намерениям», что означает поиск решения проблемы. Элементами поиска намерений являются — диалоговые подсказки при неоднозначном запросе, автоматический перевод текста, информация о характеристиках запрашиваемого автомобиля и т. д. Например, при запросе «Борис Гребенщиков — Золотой город» система покажет форму для онлайн-запроса. слушая музыку с сервиса Яндекс Музыка, по запросу «ул. Королева 12» будет показан фрагмент карты с отмеченным на ней объектом.
Защита от спама и вирусов
В 2013 году Яндекс считался самой безопасной поисковой системой на тот момент и третьей по безопасности среди всех веб-ресурсов. К 2016 году Яндекс опустился на третье место, а первое место занял Google.
Проверка веб-страниц и предупреждение пользователей появились на Яндексе в 2009 году: с тех пор на странице результатов поиска рядом с опасным сайтом есть пометка «Этот сайт может угрожать безопасности вашего компьютера». Для обнаружения угроз используются сразу две технологии. Первый был куплен у американского антивируса Sophos и основан на сигнатурном подходе: это означает, что при доступе к веб-странице антивирусная система также обращается к базе данных уже известных вирусов и вредоносных программ. Такой подход быстр, но практически бессилен против новых вирусов, еще не попавших в базу. Поэтому Яндекс наряду с сигнатурой использует и собственный антивирусный комплекс, основанный на анализе поведенческого фактора. Программа Яндекса при доступе к сайту проверяет, не запрашивал ли последний дополнительные файлы у браузера, не перенаправлял ли его на посторонний ресурс и т.д. Таким образом, при получении информации о том, что сайт начинает выполнять те или иные действия (каскадные таблицы стилей, модули JavaScript запускаются и завершают работу программы) без разрешения пользователя, помещается в «черный список» и в базу сигнатур вирусов. Информация о заражении сайта появляется в результатах поиска, а через сервис Яндекс.Вебмастер владелец сайта получает уведомление. После первой проверки Яндекс делает вторую, и если информация о заражении подтвердится во второй раз, проверки будут проводиться чаще, пока угроза не будет устранена. Общее количество зараженных сайтов в базе данных Яндекса не превышает 1%.
Каждый день в 2013 году Яндекс проверяет 23 миллиона веб-страниц (при этом выявляя 4300 опасных сайтов) и показывает пользователям 8 миллионов предупреждений. Ежемесячно проверяется около миллиарда сайтов.
Позиция в поиске
Долгое время ключевым фактором ранжирования для Яндекса было количество сторонних ссылок на тот или иной сайт. Каждой странице в Интернете был присвоен уникальный индекс цитирования, аналогичный индексу авторов научных статей: чем больше ссылок, тем лучше. Аналогичный механизм реализован в Яндексе и в PageRank от Google. В целях предотвращения накрутки Яндекс использует многофакторный анализ, в котором количество сторонних ссылок влияет только на 70 из 800 факторов. Сегодня гораздо большую роль играет наполнение сайта и наличие или отсутствие там ключевых слов, легкость чтения текста, название домена, его история и наличие мультимедийного контента.
5 декабря 2013 г. Яндекс заявил о полном отказе от учета ссылочного фактора в дальнейшем.
Поисковые подсказки
Когда пользователь вводит запрос в строке поиска, поисковая система предлагает подсказки в виде раскрывающегося списка. Подсказки появляются еще до появления результатов поиска и позволяют уточнить запрос, исправить макет или опечатку или сразу перейти на искомый сайт. Для каждого пользователя формируются подсказки, в том числе по истории его поисковых запросов (сервис «Мои находки»). В 2012 году появились так называемые «Умные поисковые подсказки», которые моментально выдают информацию об основных константах (длина экватора, скорость света и так далее), пробках и имеют встроенный калькулятор. Кроме того, был интегрирован переводчик в «Подсказки» (запрос «любовь по-французски» моментально выдает амур, привязанность), расписание и результаты футбольных матчей, курсы валют, прогнозы погоды и прочее. Вы можете узнать точное время, спросив «сколько сейчас времени». В 2011 году Подсказки в поиске Яндекса стали полностью локальными для 83 регионов России.
Помимо собственно поиска, в поисковые системы Яндекса встроены Подсказки. Словари», «Яндекс. Маркет», «Яндекс. Карты» и другие сервисы Яндекса.
Функция подсказки является следствием развития технологии поиска по намерениям и впервые появилась на Яндекс.Баре в августе 2007 г., а в октябре 2008 г. была введена на главную страницу поисковой системы Доступный как в десктопной, так и в мобильной версии сайта, Яндекс показывает своим пользователям более миллиарда поисковых подсказок в сутки
Яндекс Достижения
По словам медиаэксперта Михаила Гуревича, Яндекс — это «национальное достояние», «стратегический продукт».
Этот факт признали и в Государственной Думе РФ, где в мае 2012 года появился законопроект, в котором Яндекс и ВКонтакте признаются стратегическими предприятиями национальными трансляторами информации. В 2009 году президент России Дмитрий Медведев инициировал покупку «золотой акции» Яндекса Сбербанком, чтобы не допустить попадания важной общероссийской компании в иностранные руки.
В 2012 году Яндекс обогнал Первый канал по дневной аудитории, что сделало Яндекс лидером на отечественном медиарынке. В 2013 году Яндекс подтвердил этот статус, обогнав Первого по выручке.
В 2008 году Яндекс был девятой поисковой системой в мире, в 2009 году — седьмой, а в 2013 году — четвертой.
Одной из составляющих этой ситуации является наличие в России достаточного количества математически подкованных специалистов с научным чутьем.
К 2002 году слово «Яндекс» стало настолько нарицательным, что, когда компания Аркадия Воложа потребовала вернуть домен yandex.com, купленный третьими лицами, ответчик заявил, что слово «Яндекс» уже стало синонимом поиска и стало нарицательным. слово в России.
С конца 2012 года поисковая система Яндекс опережает Google по количеству пользователей браузера Google Chrome в России.
Хронология
В 2008 году Яндекс впервые начал открыто анонсировать изменения в алгоритме поиска и начал называть изменения названиями городов России. Название «города» каждого последующего алгоритма начинается с буквы, на которую заканчивалось название предыдущего.
Алгоритм ранжирования снова изменился.
С мая 2006 года в результатах поиска отображаются значки сайтов.
В начале декабря рядом с каждой ссылкой в результатах поиска появился пункт «Сохраненная копия», нажав на который, пользователь переходит на полную копию страницы в специальной архивной базе («кеш Яндекса»)
Летом был запущен так называемый «быстрый» поисковый робот, работающий параллельно с реальными страницами, предназначенными для индексации. База «быстрого робота» обновляется каждые 1,5–2 часа.
Алгоритм ранжирования улучшен для повышения точности поиска.
Расширены возможности поиска с помощью Яндекс. Словари» и «Яндекс. Lingvo». Поисковик научился понимать запросы типа «Что [что-то] по-испански» и автоматически переводить их.
Появилась возможность ограничивать результаты поиска по регионам.
Изменился алгоритм ранжирования.
Яндекс начал индексация документов в форматах .swf (Flash).xls и .ppt.
В конце года было опубликовано исследование «Некоторые аспекты полнотекстового поиска и ранжирования в Яндексе» (авторы Илья Сегалович, Михаил Маслов), которое выявило некоторые детали ранжирования в поисковике.
Запущено индексирование документов .rtf и .pdf. Результаты поиска стали выдаваться в том числе и в формате XML.
Количество ежедневных запросов к поисковой системе Яндекс превысило 2 миллиона
В 2001 году Яндекс обогнал по посещаемости другую российскую поисковую систему Рамблер и стал ведущей поисковой системой Рунета. Яндекс стал понимать запросы на естественном языке, заданные в вопросительной форме. Система научилась распознавать опечатки и предлагать их исправить. Дизайн изменился.
6 июня 2000 года была представлена вторая версия поисковой системы. Был введен механизм параллельного поиска, и наряду с выдачей предлагалась информация из крупных источников. Пользователи смогли ограничить результаты поиска выбранной темой. Появилась рубрика «Популярные находки» — слова, уточняющие поиск.
В декабре 2000 года объем проиндексированной информации достиг 355,22 ГБ.
Название системы — Яндекс, — придумали совместно Аркадий Волож и Илья Сегалович.
Слово расшифровывается как еще один индексатор (или как «я («я» в русском языке) и индексатор)». По интерпретации Артемия Лебедева, название поисковика созвучно Яндексу, где ян означает мужское начало.
Поисковая система yandex.ru была анонсирована компанией CompTek 23 сентября 1997 года на выставке Softool, хотя некоторые разработки в области поиска (индексация Библии, поиск документов на CD-ROM, поиск по сайту) велись компанией компания еще раньше.