Математические методы в библиотечной работе. Елизаров А.М - 233 стр.

UptoLike

ВУЗ:

КФУ | Казань

Составители:

Рубрика:

Математика

уменьшения их корреляции с запросом (см. п. 2 §16).

Когда количество релевантных документов п мало

по сравнению с объемом массива N, можно исполь-

зовать приближенные равенства

где R(i) и Р (i) — стандартные коэффициенты полноты

и точности после выдачи i документов.

При вычислении полноты и точности можно

классифицировать документы массива по релевант-

ности и выбирать ранги документов для выдачи

в случае использования нескольких уровней релевант-

ности. В обычных условиях используют только два

вида оценок релевантности: документ считается ре-

левантным (частично релевантным) или нерелевант-

ным. Если же при ранжировании документов выда-

чи обнаруживаются связи между ними (т. е. одна

и та же степень подобия запрос-документ относится

к нескольким документам), то всем им приписывается

ранг, равный среднему рангу всего множества доку-

ментов. Однако можно использовать список из l

категорий релевантности, из которых для данного

документа выбирается единственная оценка (напри-

мер, высокорелевантный, среднерелевантный, отдельно

релевантный и т. д.). Если при ранжировании в

порядке уменьшения подобия документов с запросами

встретятся связи, т. е. документы с одинаковыми

коэффициентами, то документам с более высокими

оценками релевантности внутри этого множества

документов можно будет соответственно приписать

более высокие ранги.

Дополнительными мерами, представляющими инте-

рес в виду их ориентированности на потребителя,

являются:

1. Коэффициент новизны — доля выданных систе-

мой и оцененных потребителем как релевантные

документов, о которых ему не было известно до

получения результатов поиска;

2. Коэффициент охвата — доля выданных релевант-

ных документов от общего количества релевантных

документов, известных потребителю до проведения

поиска;

233

уменьшения их корреляции с запросом (см. п. 2 §16).
Когда количество релевантных документов п мало
по сравнению с объемом массива N, можно исполь-
зовать приближенные равенства



где R(i) и Р (i) — стандартные коэффициенты полноты
и точности после выдачи i документов.
   При вычислении полноты и точности можно
классифицировать документы массива по релевант-
ности и выбирать ранги документов для выдачи
в случае использования нескольких уровней релевант-
ности. В обычных условиях используют только два
вида оценок релевантности: документ считается ре-
левантным (частично релевантным) или нерелевант-
ным. Если же при ранжировании документов выда-
чи обнаруживаются связи между ними (т. е. одна
и та же степень подобия запрос-документ относится
к нескольким документам), то всем им приписывается
ранг, равный среднему рангу всего множества доку-
ментов. Однако можно использовать список из l
категорий релевантности, из которых для данного
документа выбирается единственная оценка (напри-
мер, высокорелевантный, среднерелевантный, отдельно
релевантный и т. д.). Если при ранжировании в
порядке уменьшения подобия документов с запросами
встретятся связи, т. е. документы с одинаковыми
коэффициентами, то документам с более высокими
оценками релевантности внутри этого множества
документов можно будет соответственно приписать
более высокие ранги.
   Дополнительными мерами, представляющими инте-
рес в виду их ориентированности на потребителя,
являются:
   1. Коэффициент новизны — доля выданных систе-
мой и оцененных потребителем как релевантные
документов, о которых ему не было известно до
получения результатов поиска;
   2. Коэффициент охвата — доля выданных релевант-
ных документов от общего количества релевантных
документов, известных потребителю до проведения
поиска;
                                                233

Заказать работу

Математические методы в библиотечной работе. Елизаров А.М - 233 стр.

UptoLike

ВУЗ:

Елизаров А.М.

Хохлов Ю.Е.

Математика

Вы здесь

Математические методы в библиотечной работе. Елизаров А.М - 233 стр.

UptoLike

ВУЗ:

Елизаров А.М.

Хохлов Ю.Е.

Математика

Страницы