Содержание
Компания Яндекс — Технологии — Матрикснет
В 2009 году Яндекс внедрил новый метод машинного обучения — Матрикснет. Важная особенность этого метода — в том, что он устойчив к переобучению. Это позволяет учитывать очень много факторов ранжирования — и при этом не увеличивать количество оценок асессоров и не опасаться, что машина найдет несуществующие закономерности. Матрикснет — это метод машинного обучения, с помощью которого строится формула ранжирования Яндекса.
С помощью Матрикснета можно построить очень длинную и сложную формулу ранжирования, которая учитывает множество различных факторов и их комбинаций. Другие методы машинного обучения позволяют либо строить более простые формулы с меньшим количеством факторов, либо нуждаются в большей обучающей выборке. Матрикснет строит формулу с десятками тысяч коэффициентов. Это позволяет сделать существенно более точный поиск.
Ещё одна важная особенность Матрикснета — в том, что формулу ранжирования можно настраивать отдельно для достаточно узких классов запросов. Например, улучшить качество поиска только по запросам про музыку. При этом ранжирование по остальным классам запросов не ухудшится. Для примера можно представить себе формулу ранжирования в виде сложного механизма с большим количеством ручек. На механизмах, построенных по другим технологиям, каждая ручка влияет на все запросы. Матрикснет даёт возможность настроить каждую ручку отдельно для своего класса запросов.
Кроме того, Матрикснет автоматически выбирает разную чувствительность для разных диапазонов значений факторов ранжирования. Это в чём-то похоже на работу на аэродроме — когда среди постоянного шума взлетающих самолётов нужно слышать и голоса людей. Если заткнуть уши, то самолёты будут слышны, а голоса — нет. Сотрудники аэропорта работают в специальных наушниках, слабо чувствительных к громкому шуму — так можно услышать и самолёты, и голоса людей.
Поскольку поисковая система работает с очень большими объёмами информации, по каждому запросу ей нужно проверить признаки миллионов страниц, определить их релевантность и соответственно упорядочить — так, чтобы сверху оказались более подходящие страницы. Чтобы проверить свойства всех страниц по очереди, нужно либо очень много серверов, которые могут быстро обработать информацию обо всех страницах, либо очень много времени — а поиск должен работать быстро, иначе пользователи не дождутся результатов. Матрикснет позволяет проверить очень много факторов за короткое время и без существенного увеличения вычислительных мощностей.
Поиск ведётся одновременно на тысячах серверов. Каждый сервер ищет по своей части индекса и формирует список самых лучших результатов. В него гарантированно попадают все самые релевантные запросу страницы.
Дальше из этих списков составляется один общий, и страницы, попавшие туда, упорядочиваются по формуле ранжирования — той самой длинной и сложной формуле, построенной с помощью Матрикснета, с учётом всех факторов и их комбинаций. Таким образом, наверху поисковой выдачи оказываются все самые релевантные сайты — и пользователь почти мгновенно получает ответ на свой вопрос.
[МЕТОД РАНГОВЫХ ПОКАЗАТЕЛЕЙ И ЕГО ИСПОЛЬЗОВАНИЕ ДЛЯ СРАВНИТЕЛЬНОГО АНАЛИЗА ЗДОРОВЬЯ НАСЕЛЕНИЯ]
. 2016;95(3):306-11.
[Статья в
Русский]
Большаков А.М., Крутько В.Н., Смирнова Т.М., Чанков С.В.
PMID:
27266035
[Статья в
Русский]
Большаков А.М. и др.
Гиг Санит.
2016.
. 2016;95(3):306-11.
Авторы
Большаков А.М., Крутько В.Н., Смирнова Т.М., Чанков С.В.
PMID:
27266035
Абстрактный
Представлен расчетный метод, направленный на повышение информативности интегральных показателей социально-гигиенического мониторинга для целей сравнительного анализа. Метод ранговых показателей основан на ранжировании объектов мониторинга по значениям первичных показателей, на основе которых рассчитываются такие интегральные показатели, как, например, ожидаемая продолжительность жизни. Представлены результаты использования этого метода для сравнительного анализа смертности в государствах-членах ВОЗ за период 1990-2011. Выявлены особенности динамики смертности, которые не могут быть обнаружены при использовании только коэффициентов смертности или ожидаемой продолжительности жизни. В частности, для России показано, что, несмотря на тенденцию к снижению детской и подростковой смертности, наблюдаемую в последнее десятилетие, мировые рейтинги страны по этим показателям не достигают уровня 1990 г. Это означает, что конкурентоспособность страна, резко пришедшая в упадок в 90-х, не восстановилась до сих пор. Описаны некоторые особенности использования метода ранговых показателей для анализа показателей состояния окружающей среды, здоровья населения и его социально-экономических детерминант.
Похожие статьи
Улучшение показателей здоровья матери и ребенка в Турции.
Акин А, Кёсели А.
Акин А и др.
Терк Дж. Педиатр. 1997 г., апрель-июнь; 39(2):227-38.
Терк Дж. Педиатр. 1997.PMID: 9223921
Изменения продолжительности жизни в России в середине 1990-х гг.
Школьников В., Макки М., Леон Д.А.
Школьников В, и др.
Ланцет. 2001 24 марта; 357 (9260): 917-21. doi: 10.1016/S0140-6736(00)04212-4.
Ланцет. 2001.PMID: 11289348
[Кластерный анализ районов и городских округов в земле Северный Рейн-Вестфалия на основе показателей здоровья].
Штромайер К. П., Шульц А., Бардель Д., Аннусс Р., Ленц А.
Стромайер К.П. и др.
Gesundheitswesen. 2007 янв; 69(1):26-33. doi: 10.1055/s-2007-960491.
Gesundheitswesen. 2007.PMID: 17347929
Немецкий.
Прогнозирование воздействия СПИДа на смертность.
Стовер Дж., Уэй П.
Стовер Дж. и др.
СПИД. 1998; 12 Приложение 1: S29-39.
СПИД. 1998.PMID: 9677187
Обзор.
Роль клинической суицидологии в системе мероприятий, направленных на снижение ранней смертности и увеличение продолжительности жизни населения.
Дмитриева Т.Б., Положий Б.С.
Дмитриева Т.Б. и соавт.
Вестн Росс Акад Мед Наук. 2006;(8):18-22.
Вестн Росс Акад Мед Наук. 2006.PMID: 17002021
Обзор.
Русский.
Посмотреть все похожие статьи
Типы публикаций
термины MeSH
Метод 23: Упражнения по ранжированию и определению
Перейти к другим методам: МЕТОД 1: Мозговой штурм МЕТОД 2: Изучение конкретных ситуаций МЕТОД 3: Закрытие МЕТОД 4: Творческое самовыражение МЕТОД 5: Дебаты и переговоры МЕТОД 6: Дискуссия МЕТОД 7: Инсценировки МЕТОД 8: Энергетики МЕТОД 9: Фильмы и видео 12: Слушания и трибуналы МЕТОД 13: Ледоколы и представления МЕТОД 14: Интерпретация изображений МЕТОД 15: Интервью МЕТОД 16: Мозаика МЕТОД 17: Написание журнала МЕТОД 18: Медиа МЕТОД 19МЕТОД 20: Открытый стимул МЕТОД 21: Презентации МЕТОД 22: Исследовательские проекты МЕТОД 23: Ранжирование и определение упражнений МЕТОД 24: Моделирование МЕТОД 25: Рассказывание историй МЕТОД 26: Изучение мнений и информации
Сбор МЕТОД 27: Действия с паутиной
Рейтинговые мероприятия требуют участников, индивидуально
или в группах, чтобы определить приоритеты конкурирующих альтернатив и объяснить их
выбор. Они являются отличным методом для определения ценностей, обсуждения
противоречащие друг другу точки зрения и достижение консенсуса. Например, участники
могут ранжировать права, наиболее важные для них, выбирать, какие элементы
общества заслуживают наибольшей помощи со стороны государства, или решить, какие стратегии
наиболее эффективны для улучшения благосостояния детей.
1. Рейтинг лестницы: Дайте небольшим группам
участников от шести до двенадцати утверждений на отдельных карточках или стикерах.
Попросите их расположить утверждения в вертикальном порядке по степени их важности.
с самым важным на вершине «лестницы». Спросите группы
с теми же утверждениями, чтобы сравнить и объяснить их результаты.
2. Алмазный рейтинг: Дайте небольшим группам
участники девять утверждений, написанных на карточках или стикерах. Спросите их
расположить утверждения в форме ромба: самое важное утверждение
вверху два заявления одинаковой, но меньшей важности во втором
ряд, три утверждения средней важности в третьем ряду, два утверждения
относительно небольшой важности в четвертом ряду и наименее важной
заявление внизу.