Математические методы в библиотечной работе. Елизаров А.М - 233 стр.

UptoLike

Составители: 

Рубрика: 

уменьшения их корреляции с запросом (см. п. 2 §16).
Когда количество релевантных документов п мало
по сравнению с объемом массива N, можно исполь-
зовать приближенные равенства
где R(i) и Р (i) стандартные коэффициенты полноты
и точности после выдачи i документов.
При вычислении полноты и точности можно
классифицировать документы массива по релевант-
ности и выбирать ранги документов для выдачи
в случае использования нескольких уровней релевант-
ности. В обычных условиях используют только два
вида оценок релевантности: документ считается ре-
левантным (частично релевантным) или нерелевант-
ным. Если же при ранжировании документов выда-
чи обнаруживаются связи между ними (т. е. одна
и та же степень подобия запрос-документ относится
к нескольким документам), то всем им приписывается
ранг, равный среднему рангу всего множества доку-
ментов. Однако можно использовать список из l
категорий релевантности, из которых для данного
документа выбирается единственная оценка (напри-
мер, высокорелевантный, среднерелевантный, отдельно
релевантный и т. д.). Если при ранжировании в
порядке уменьшения подобия документов с запросами
встретятся связи, т. е. документы с одинаковыми
коэффициентами, то документам с более высокими
оценками релевантности внутри этого множества
документов можно будет соответственно приписать
более высокие ранги.
Дополнительными мерами, представляющими инте-
рес в виду их ориентированности на потребителя,
являются:
1. Коэффициент новизны доля выданных систе-
мой и оцененных потребителем как релевантные
документов, о которых ему не было известно до
получения результатов поиска;
2. Коэффициент охватадоля выданных релевант-
ных документов от общего количества релевантных
документов, известных потребителю до проведения
поиска;
233
уменьшения их корреляции с запросом (см. п. 2 §16).
Когда количество релевантных документов п мало
по сравнению с объемом массива N, можно исполь-
зовать приближенные равенства



где R(i) и Р (i) — стандартные коэффициенты полноты
и точности после выдачи i документов.
   При вычислении полноты и точности можно
классифицировать документы массива по релевант-
ности и выбирать ранги документов для выдачи
в случае использования нескольких уровней релевант-
ности. В обычных условиях используют только два
вида оценок релевантности: документ считается ре-
левантным (частично релевантным) или нерелевант-
ным. Если же при ранжировании документов выда-
чи обнаруживаются связи между ними (т. е. одна
и та же степень подобия запрос-документ относится
к нескольким документам), то всем им приписывается
ранг, равный среднему рангу всего множества доку-
ментов. Однако можно использовать список из l
категорий релевантности, из которых для данного
документа выбирается единственная оценка (напри-
мер, высокорелевантный, среднерелевантный, отдельно
релевантный и т. д.). Если при ранжировании в
порядке уменьшения подобия документов с запросами
встретятся связи, т. е. документы с одинаковыми
коэффициентами, то документам с более высокими
оценками релевантности внутри этого множества
документов можно будет соответственно приписать
более высокие ранги.
   Дополнительными мерами, представляющими инте-
рес в виду их ориентированности на потребителя,
являются:
   1. Коэффициент новизны — доля выданных систе-
мой и оцененных потребителем как релевантные
документов, о которых ему не было известно до
получения результатов поиска;
   2. Коэффициент охвата — доля выданных релевант-
ных документов от общего количества релевантных
документов, известных потребителю до проведения
поиска;
                                                233