Релевантность поиска :: Справочник :: Тематические статьи и обзоры :: Для клиентов :: Умные решения
  
логин:
пароль:

тел. 8 (913) 463 2OO8
Обратная связь

Релевантность поиска


Допустим, что мы решили обзавестись четырёхколёсным другом и, чтобы купить легковушку, пытаемся вначале узнать что-нибудь об автомобилях. Вводим в поисковой системе слово "машина" (это ведь так называется?) и получаем: "боевая машина пехоты", "машина баз данных", "машинка для точной подстройки скрипичных струн", "адская машина", "бездушная судебная машина" и т. п. Всё найденное релевантно запросу, однако совершенно не пертинентно информационной потребности. Стоит, однако, ввести запрос "легковой автомобиль", и всё, релевантное ему, окажется пертинентным информационной потребности.

Релевантность поиска

Пертине́нтность (англ. pertinence) — соотношение объёма полезной информации к общему объёму полученной информации. Коротко — это пользосоответствие может быть выражено в виде процента наподобие КПД (коэффициент полезного действия). Пертине́нтность (англ. pertinence) — соответствие найденных информационно-поисковой системой документов информационным потребностям пользователя. Релева́нтность (англ. relevant) — применительно к результатам работы поисковой системы и экспертной системы — степень соответствия запроса и найденного, то есть уместность результата. В более общем смысле, одно из наиболее близких понятию качества «релевантности» — «адекватность», то есть оценка степени соответствия, но и степени практической применимости результата, а также степени социальной применимости варианта решения задачи. Это субъективное понятие, поскольку результаты поиска, уместные для одного пользователя, могут быть неуместными для другого. Основным методом для оценки релевантности является TF-IDF-метод, который используется в большинстве поисковых систем (как в интернет-поисковиках, так и в справочных системах (MSDN). Его смысл сводится к тому, что чем больше локальная частота термина (запроса) в документе (TF) и больше «редкость» (то есть чем реже он встречается в других документах) термина в коллекции (IDF), тем выше вес данного документа по отношению к термину — то есть документ будет выдаваться раньше в результатах поиска по данному термину. Автором метода является Gerard Salton (в дальнейшем доработан Karen Sparck Jones).
2010-01-19Материал из Википедии
<<< Поисковый алгоритмКлючевое слово >>>
2010 © UMNO.RU