Математические методы в библиотечной работе. Елизаров А.М - 231 стр.

UptoLike

Составители: 

Рубрика: 

подтверждают этот вывод. Сказывается, что кроме
А, В, С имеют отрицательное биномиальное распреде-
ление и следующие случайные величины: D — коли-
чество релевантных невиданных ответов, Е коли-
чество нерелевантных выданных ответов, F количе-
ство нерелевантных невыданных ответов.
Пусть R и Рсоответственно коэффициенты
полноты и точности. Из предыдущих построений
следует, что
Вычисление этих величин несложно только в том
случае, если имеются исчерпывающие оценки реле-
вантности каждого документа относительно каждого
запроса и если можно однозначно определить крите-
рий разбиения, отделяющий релевантные документы
от нерелевантных.
Когда размер фонда сравнительно невелик, имеется
возможность получить исчерпывающие оценки
релевантности каждого документа по отношению
к каждому запросу. В таких случаях всем релевант-
ным документам может быть приписан ранг в поряд-
ке уменьшения подобия запросдокумент. При бо-
лее крупных фондах исчерпывающие оценки релевант-
ности невозможны. В таком случае используют
статистические методы и получают список релевант-
ных документов на основе оценок релевантности
только выданного множества документов.
Опишем, как можно получить средние значения
показателей эффективности, если известны значения
коэффициентов эффективности для k различных зап-
росов пользователей. Пусть:
a
i
количество документов, выданных и релевант-
ных запросу i;
b
i
количество документов, выданных, но не ре-
левантных запросу i;
С
i
количество релевантных запросу i, но не
выданных документов;
d
i
количество нерелевантных запросу i и не вы-
231
подтверждают этот вывод. Сказывается, что кроме
А, В, С имеют отрицательное биномиальное распреде-
ление и следующие случайные величины: D — коли-
чество релевантных невиданных ответов, Е— коли-
чество нерелевантных выданных ответов, F— количе-
ство нерелевантных невыданных ответов.
   Пусть R и Р — соответственно коэффициенты
полноты и точности. Из предыдущих построений
следует, что




Вычисление этих величин несложно только в том
случае, если имеются исчерпывающие оценки реле-
вантности каждого документа относительно каждого
запроса и если можно однозначно определить крите-
рий разбиения, отделяющий релевантные документы
от нерелевантных.
   Когда размер фонда сравнительно невелик, имеется
возможность получить исчерпывающие оценки
релевантности каждого документа по отношению
к каждому запросу. В таких случаях всем релевант-
ным документам может быть приписан ранг в поряд-
ке уменьшения подобия запрос — документ. При бо-
лее крупных фондах исчерпывающие оценки релевант-
ности невозможны. В таком случае используют
статистические методы и получают список релевант-
ных документов на основе оценок релевантности
только выданного множества документов.
    Опишем, как можно получить средние значения
показателей эффективности, если известны значения
коэффициентов эффективности для k различных зап-
росов пользователей. Пусть:
   ai — количество документов, выданных и релевант-
       ных запросу i;
    bi — количество документов, выданных, но не ре-
      левантных запросу i;
    Сi — количество релевантных запросу i, но не
      выданных документов;
   di — количество нерелевантных запросу i и не вы-
                                                231