ВУЗ:
Составители:
Рубрика:
уменьшения их корреляции с запросом (см. п. 2 §16).
Когда количество релевантных документов п мало
по сравнению с объемом массива N, можно исполь-
зовать приближенные равенства
где R(i) и Р (i) — стандартные коэффициенты полноты
и точности после выдачи i документов.
При вычислении полноты и точности можно
классифицировать документы массива по релевант-
ности и выбирать ранги документов для выдачи
в случае использования нескольких уровней релевант-
ности. В обычных условиях используют только два
вида оценок релевантности: документ считается ре-
левантным (частично релевантным) или нерелевант-
ным. Если же при ранжировании документов выда-
чи обнаруживаются связи между ними (т. е. одна
и та же степень подобия запрос-документ относится
к нескольким документам), то всем им приписывается
ранг, равный среднему рангу всего множества доку-
ментов. Однако можно использовать список из l
категорий релевантности, из которых для данного
документа выбирается единственная оценка (напри-
мер, высокорелевантный, среднерелевантный, отдельно
релевантный и т. д.). Если при ранжировании в
порядке уменьшения подобия документов с запросами
встретятся связи, т. е. документы с одинаковыми
коэффициентами, то документам с более высокими
оценками релевантности внутри этого множества
документов можно будет соответственно приписать
более высокие ранги.
Дополнительными мерами, представляющими инте-
рес в виду их ориентированности на потребителя,
являются:
1. Коэффициент новизны — доля выданных систе-
мой и оцененных потребителем как релевантные
документов, о которых ему не было известно до
получения результатов поиска;
2. Коэффициент охвата — доля выданных релевант-
ных документов от общего количества релевантных
документов, известных потребителю до проведения
поиска;
233
уменьшения их корреляции с запросом (см. п. 2 §16). Когда количество релевантных документов п мало по сравнению с объемом массива N, можно исполь- зовать приближенные равенства где R(i) и Р (i) — стандартные коэффициенты полноты и точности после выдачи i документов. При вычислении полноты и точности можно классифицировать документы массива по релевант- ности и выбирать ранги документов для выдачи в случае использования нескольких уровней релевант- ности. В обычных условиях используют только два вида оценок релевантности: документ считается ре- левантным (частично релевантным) или нерелевант- ным. Если же при ранжировании документов выда- чи обнаруживаются связи между ними (т. е. одна и та же степень подобия запрос-документ относится к нескольким документам), то всем им приписывается ранг, равный среднему рангу всего множества доку- ментов. Однако можно использовать список из l категорий релевантности, из которых для данного документа выбирается единственная оценка (напри- мер, высокорелевантный, среднерелевантный, отдельно релевантный и т. д.). Если при ранжировании в порядке уменьшения подобия документов с запросами встретятся связи, т. е. документы с одинаковыми коэффициентами, то документам с более высокими оценками релевантности внутри этого множества документов можно будет соответственно приписать более высокие ранги. Дополнительными мерами, представляющими инте- рес в виду их ориентированности на потребителя, являются: 1. Коэффициент новизны — доля выданных систе- мой и оцененных потребителем как релевантные документов, о которых ему не было известно до получения результатов поиска; 2. Коэффициент охвата — доля выданных релевант- ных документов от общего количества релевантных документов, известных потребителю до проведения поиска; 233
Страницы
- « первая
- ‹ предыдущая
- …
- 231
- 232
- 233
- 234
- 235
- …
- следующая ›
- последняя »