Что такое релевантность. По релевантности
Что такое релевантность: понятие, определение.
Релевантность — это понятие, необходимое для описания алгоритма работы поисковиков, которые предоставляют пользователям список наиболее отвечающих введенным запросам сайтов.
Попробуем дать определение релевантности. Итак, релевантность — это метод поиска документов, которые содержат какие-либо искомые слова, а также документов, схожих с тематикой ключевого запроса.Кроме того релевантность определяется по средствам задачи и проблемы, встречающимися в результате произведения поиска.
Как определяют релевантность поисковые машины
Поисковики также проводят анализ этих концепций для определения показателей релевантности. В не так давно появившемся патенте, выданном Гугл, озвучивается четкое определение способа поиска страниц.
Описанный в патенте метод определения показателей релевантности кроме использования термина поискового запроса также открывает и такое понятие, как «ярлык», совпадающее с понятием «аннотация».Чтобы было понятнее, приведем такой пример. Пользователю необходимо найти информацию о новинках мобильных телефонов. В Поисковик он вводит такой запрос: «мобильные телефоны новинки».Поисковик выдает страницы, релевантные запросу «мобильные телефоны», при этом среди них будут отмечены сайты со страницами, имеющими ярлык «новинки».
Если пользователи к запросу добавят дополнительную информацию — ярлыки, Поисковики найдут более релевантные страницы.Как же происходит построение в алгоритме поисковиков ярлыков и аннотаций?
Итак, например, сайт посвящен продаже все тех же мобильных телефонов. На нем могут быть размещены теги и категории для статей. Например, в статьях могут встречаться слова «новинки», также «обзоры мобильных». Кроме того, аннотации могут встречаться и в списке комментариев к статьям.
Подобного рода теги полезные, но в выдачу поисковиков Яндекса и Google, к примеру, они не попадут. Поисковики просто не считают их тегами, несмотря на возможную полезную информацию, содержащуюся в них.Для определения аннотаций поисковики используют разные методы, например, просматривая данные о партнерах в адресе ресурса. Эти алгоритмы поиска уже давно используют для продвижения ресурсов оптимизаторы.
Сервисы для определения показателей релевантности
Сегодня существует достаточно бесплатных программ, с помощью которых не составит труда определить релевантность сайта. Самая популярная из них – это SESpider, предназначенная для определений позиций ресурса по определенным ключевым запросам.
Кроме того, программа определяет тИЦ и PR ресурса. Не менее известное приложение – это Position Watcher, предназначенное для мониторинга позиций ресурса по ключевым фразам. Также поиском релевантных по определенным ключевым запросам сайтов занимается программа Seo Pressing, которая в отличие от предыдущих двух является платной.
ВыводИтак, в заключение хотелось бы отметить следующее. Сама идея добавить «ярлыки» в алгоритм поиска поисковыми машинами, безусловно, заслуживает внимания. Но, до сих пор пока не ясно, какое количество пользователей смогут для себя использовать подобное нововведение.
На самом деле использование ярлыков может во много раз облегчить поиск нужной информации в определенных ситуациях. Кроме того, ярлыки, для поиска данных смогли бы повлиять на увеличение показателей релевантности страниц при выдаче по поисковым запросам определенной тематики. Сегодня Гугл уже предоставляет возможность своим пользователем использовать ярлыки в процессе пользовательского поиска.
Что из этого выйдет? Время покажет.
Про здоровье:Если подобная техническая информация вам неинтересна а вы хотите поправить свое здоровье, то вам может помочь эллиптический тренажер. Только есть одно условие, нужно регулярно заниматься на тренажере.
anokalintik.ru
Релевантность - это... Что такое Релевантность?
Релева́нтность (лат. relevo — поднимать, облегчать) в информационном поиске — семантическое соответствие поискового запроса и поискового образа документа.[1] В более общем смысле, одно из наиболее близких понятию качества «релевантности» — «адекватность», то есть не только оценка степени соответствия, но и степени практической применимости результата, а также степени социальной применимости варианта решения задачи.[источник не указан 732 дня]
Виды релевантности
Содержательная релевантность
Соответствие документа информационному запросу, определяемое неформальным путем.[1]
Формальная релевантность
Соответствие, определяемое путем сравнения образа поискового запроса с поисковым образом документа по определенному алгоритму.[1]
Одним из методов для оценки релевантности является TF-IDF-метод. Его смысл сводится к тому, что чем больше локальная частота термина (запроса) в документе (TF) и больше «редкость» (то есть чем реже он встречается в других документах) термина в коллекции (IDF), тем выше вес данного документа по отношению к термину — то есть документ будет выдаваться раньше в результатах поиска по данному термину. Автором метода является Gerard Salton (в дальнейшем доработан Karen Sparck Jones).[источник не указан 732 дня]
Пертинентность
Пертине́нтность (лат. pertineo — касаюсь, отношусь) — соответствие найденных информационно-поисковой системой документов информационным потребностям пользователя, независимо от того, как полно и как точно эта информационная потребность выражена в тексте информационного запроса. Иначе говоря, это соотношение объёма полезной информации к общему объёму полученной информации.[1]
Примечания
- ↑ 1 2 3 4 Словарь по кибернетике / Под редакцией академика В. С. Михалевича. — 2-е. — Киев: Главная редакция Украинской Советской Энциклопедии имени М. П. Бажана, 1989. — 751 с. — (С48). — 50 000 экз. — ISBN 5-88500-008-5
См. также
Литература
biograf.academic.ru
Что такое релевантность поиска, страницы
Когда пользователь хочет найти в интернете информацию, он вбивает в поисковую строку конкретный вопрос и ждёт от системы релевантной выдачи. Но, очень часто этого не происходит. Получается, что страница оказалась не релевантной. Так что такое релевантность?
Понятие релевантности
Релевантность (relevant — относящийся к делу) — соответствие текста требуемым ожиданиям. Другими словами это соответствие искомого и найденного. Значит, релевантная страница это именно то, что ожидал увидеть пользователь, делая запрос в строке поиска. Этот термин стали использовать в современных системах.
Но как же поисковая система определяет эту релевантность, как она решает какую страницу в нужный момент следует предложить? Для этого и существует релевантность поиска, которую каждая система высчитывает с помощью различных алгоритмов. Так что такое релевантность поиска?
Когда пользователь набирает свой запрос в Google или Яндекс, система оценивает документы из своего индекса и выбирает те, которые больше соответствуют запросу. Посетители оценивают работу поисковика по релевантности. Если полученный ответ не удовлетворил пользователя, то он, возможно, больше не захочет пользоваться этой системой.
Поэтому самая главная задача для поисковых систем — найти самые релевантные документы. Это влияет не только на популярность ресурса, но и на его прибыль.
Виды релевантности поиска
- Формальный. При помощи алгоритма происходит сравнивание запроса с видом документа в поисковой машине. В данном способе релевантность высчитывается без участия человека. Всё происходит при помощи поискового робота, по заданной формуле, на основе введенных данных.
- Содержательный. Такой вид применяется в поисковых машинах, но для оценки качества поиска. Специалисты, которых называют асессорами, оценивают результаты поиска, сравнивая их с запросом.
- Пертинентный. К такому виду поиска стремятся все поисковые ресурсы. В данном случае информация полностью удовлетворяет пользователя.
Любая поисковая система работает по собственному алгоритму и каждой системы существует своя фишка, но принцип у всех очень схож:
- Для начала проверяется, насколько часто встречается заданный вопрос или словосочетание на выбранных страницах.
- Идёт проверка промежутка между словами.
- Проверяется количество ссылок на страницу.
- Учитывается, каким текстом набрано словосочетание.
- Проверяется возраст сайта.
Количество информации в сети постоянно увеличивается, поэтому повышение релевантности очень важная задача для каждой системы поиска.
У всех ресурсов существует много страниц, которые соответствуют требованиям запроса. Алгоритм системы поиска предложит самую релевантную страницу. Так что такое релевантность страницы?
Как определяется релевантная страница
Страница сайта — это свой собственный мир в сети. Этот контент содержит текст, изображения. Он перекликается с множеством других страниц. Исходя из этого, получается, что на релевантность влияет, как и содержание текста, так и взаимодействие с другими сайтами.
Внутренняя (содержание текста) релевантность — соответствие содержания текста требованиям системы поиска. Когда при вводе запроса словосочетания на странице будут наиболее употребляемые, то она будет релевантной. У каждого поисковика своя совокупность соотношения вхождений требуемого словосочетания к количеству слов в написанной статье. Чем ближе это число окажется к числу системы, тем выше окажется текст на странице поиска.
Основные параметры оценки страницы
- Несмотря на то, что в каждой системе поиска свой алгоритм, принцип поиска у всех похож. Внутренняя составляющая оценки релевантности:
- Частота употребления нужного словосочетания в написанном тексте. Если общее количество употреблений нужного словосочетания близко к установленному системой, тем выше релевантность страницы.
- Расположение нужных слов в заголовках и подзаголовках. Когда требуемое словосочетание расположено в заголовке текста, то уровень оценки текста повышается.
- Нужные словосочетания находятся в начале страницы. Система начинает поиск с начала страницы, поэтому, чем быстрее встретится заданный запрос, тем выше релевантность.
- Требуемые слова в нужных местах. При наличии нужных слов в заголовках и подзаголовках релевантность повышается.
- Присутствие синонимов. Это важная часть документа. Если в тексте присутствуют синонимы требуемых слов, система сочтёт такой текст полезным и относящимся к заданной теме.
К внешней составляющей относятся ссылки. Здесь следует обратить внимание на число ссылок с текстами. Если в текст ссылки попадает нужное словосочетание, то страница сразу повышает свою оценку.
Так же на релевантность влияет авторитетность сайта. В системах поиска любой сайт имеет рейтинг. Показатели, влияющие на рейтинг:
- Количество ссылок, которые ведут на сайт. Это указывает на значимость сайта среди других ресурсов.
- Соответствие сайта требуемым словам. Чем больше количество страниц, отвечающих нужным словосочетаниям, тем выше авторитет.
Конечно, существуют другие технические приемы поисковых машин, по которым они считают одну страницу релевантной, а другую нет. Их достаточно много и раскрывать их не в интересах систем, которые хотят улучшить релевантность для своих пользователей.
- Но как бы не улучшали системы поиска, не стоит забывать несколько важных вещей:
- Полученный результат зависит не только от системы, но и от того насколько удачно и точно был сформулирован запрос, указаны нужные слова.
- У каждого человека свой кругозор, своё восприятие жизни и содержание одной и той же информации будет разной для каждого человека.
У всех поисковых систем:
- Собственные задачи.
- Различные финансовые возможности.
- Сотрудники со своим мировоззрением и кругозором, у всех разный возраст и разное мышление.
Изучив подробно статью, вы найдете ответ на вопрос, что такое релевантность.
topkin.ru
Релевантность
В поисковой терминологии релевантность — это степень соответствия найденного документа поисковому запросу. Именно релевантностью определяется, попадет ли вообще документ в поисковую выдачу по этому запросу, а если попадет, то насколько близко к ее началу. Этот термин происходит от английского relevancy, который имеет несколько смежных значений. Это и «соответствие», и «уместность», и «актуальность», и даже «правомерность».
В простейшем случае релевантность запросу — это наличие слов запроса в тексте документа. Этого достаточно для простого поиска по небольшой базе документов. Но с ростом базы степень соответствия нужно было определять точнее, чем просто «есть или нет».
Первым уточнением было определение расстояния между словами в тексте — просто говоря, находится ли в тексте весь запрос как есть («прямое вхождение» запроса), или между словами запроса в тексте есть какие-то другие слова, или же отдельные слова запроса попадаются в независимых блоках текста (в разных пассажах). Очевидно, что самым релевантным считался документ с прямым вхождением, а с разбросанными по разным пассажам словами — наименее релевантным. Релевантность документа, в котором слова запроса были в одном пассаже (или смежных), но между ними встречались другие слова, рассчитывалась по «расстоянию между словами». То есть, чем меньше посторонних слов между словами запроса, тем более релевантен документ.
Для полноты поиска важны не только прямые вхождения. Запросу могут полностью соответствовать документы, в которых слова запроса встречаются в разных формах (например, существительные в единственном и множественном числе, в разных падежах). Следующей поправкой к определению релевантности стал учет морфологии.
Затем для большей полноты поиска потребовалось учитывать и синонимы. Например, один и тот же документ может соответствовать запросам «автомобиль в аренду» и «автомобиль напрокат». Такие синонимические замены некоторые оптимизаторы называли «переколдовкой запроса».
Пертинентность (от англ. pertinence) — это оценка семантического (в данном случае смыслового) соответствия текста запросу. Этот пока редко употребляемый термин дополняет привычную формальную релевантность. В большой базе очень многие документы могут считаться по каким-то признакам релевантными запросу. Но не все они соответствуют запросу с человеческой точки зрения. Например, в этом тексте есть слово «морфология», но это не значит, что текст о морфологии. Анализ текста с определением его тематики и выделением ключевых слов позволяет судить о том, имеет ли текст отношение к запросу по смыслу.
Для оценки пертинентности выборка слов из текста проверяется на соответствие ограниченным «словарям», имеющим отношение к какой-либо тематике. По наиболее подходящему словарю определяется тематика текста, и текст считается релевантным тем запросам, которые совпадают по тематике. В идеальном случае1) этот текст не будет показан в выдаче по запросу «аренда автомобиля», хотя эти слова в нем и содержатся.
Наверхwiki.webimho.ru