ВУЗ:
Составители:
Рубрика:
подтверждают этот вывод. Сказывается, что кроме
А, В, С имеют отрицательное биномиальное распреде-
ление и следующие случайные величины: D — коли-
чество релевантных невиданных ответов, Е— коли-
чество нерелевантных выданных ответов, F— количе-
ство нерелевантных невыданных ответов.
Пусть R и Р — соответственно коэффициенты
полноты и точности. Из предыдущих построений
следует, что
Вычисление этих величин несложно только в том
случае, если имеются исчерпывающие оценки реле-
вантности каждого документа относительно каждого
запроса и если можно однозначно определить крите-
рий разбиения, отделяющий релевантные документы
от нерелевантных.
Когда размер фонда сравнительно невелик, имеется
возможность получить исчерпывающие оценки
релевантности каждого документа по отношению
к каждому запросу. В таких случаях всем релевант-
ным документам может быть приписан ранг в поряд-
ке уменьшения подобия запрос — документ. При бо-
лее крупных фондах исчерпывающие оценки релевант-
ности невозможны. В таком случае используют
статистические методы и получают список релевант-
ных документов на основе оценок релевантности
только выданного множества документов.
Опишем, как можно получить средние значения
показателей эффективности, если известны значения
коэффициентов эффективности для k различных зап-
росов пользователей. Пусть:
a
i
— количество документов, выданных и релевант-
ных запросу i;
b
i
— количество документов, выданных, но не ре-
левантных запросу i;
С
i
— количество релевантных запросу i, но не
выданных документов;
d
i
— количество нерелевантных запросу i и не вы-
231
подтверждают этот вывод. Сказывается, что кроме
А, В, С имеют отрицательное биномиальное распреде-
ление и следующие случайные величины: D — коли-
чество релевантных невиданных ответов, Е— коли-
чество нерелевантных выданных ответов, F— количе-
ство нерелевантных невыданных ответов.
Пусть R и Р — соответственно коэффициенты
полноты и точности. Из предыдущих построений
следует, что
Вычисление этих величин несложно только в том
случае, если имеются исчерпывающие оценки реле-
вантности каждого документа относительно каждого
запроса и если можно однозначно определить крите-
рий разбиения, отделяющий релевантные документы
от нерелевантных.
Когда размер фонда сравнительно невелик, имеется
возможность получить исчерпывающие оценки
релевантности каждого документа по отношению
к каждому запросу. В таких случаях всем релевант-
ным документам может быть приписан ранг в поряд-
ке уменьшения подобия запрос — документ. При бо-
лее крупных фондах исчерпывающие оценки релевант-
ности невозможны. В таком случае используют
статистические методы и получают список релевант-
ных документов на основе оценок релевантности
только выданного множества документов.
Опишем, как можно получить средние значения
показателей эффективности, если известны значения
коэффициентов эффективности для k различных зап-
росов пользователей. Пусть:
ai — количество документов, выданных и релевант-
ных запросу i;
bi — количество документов, выданных, но не ре-
левантных запросу i;
Сi — количество релевантных запросу i, но не
выданных документов;
di — количество нерелевантных запросу i и не вы-
231
Страницы
- « первая
- ‹ предыдущая
- …
- 229
- 230
- 231
- 232
- 233
- …
- следующая ›
- последняя »
