Математические методы в библиотечной работе. Елизаров А.М - 232 стр.

UptoLike

Составители: 

Рубрика: 

данных документов. Тогда коэффициенты полноты R
i
и точности Р
i
для запроса i примут вид
R
i
= a
i
/ (a
i
+ c
i
), P
i
= a
i
/ (a
i
+ b
i
).
Для получения средних значений коэффициентов
по всем k запросам берем средние арифметические
Еще одна средняя величина получается путем исполь-
зования в качестве критерия суммарного количества
выданных системой релевантных документов по k
запросам, а также суммарного количества отклонен-
ных системой нерелевантных документов. Такие
средние определяются формулой
Существует еще один показательспецифич-
ность S, который по одному запросу вычисляется
по формуле S
i
= d
i
/(b
i
+ d
i
). Специфичность показы-
вает способность системы не выдавать нерелевантные
документы. Введение этого показателя позволяет при
оценке эффективности ИПС учитывать такой важный
параметр, как общий объем документального массива.
В дополнение к стандартным мерам полноты и
точности, значения которых зависят от размера
множества выданных документов, имеется возмож-
ность использовать показатели, не зависящие от
выданного множества. Одними из таких показателей
являются нормализированные полнота и точность:
где п,— объем множества релевантных документов,
N —объем всего массива, r
i
ранг i-го релевантного
документа, когда они расположены в порядке
232
данных документов. Тогда коэффициенты полноты Ri
и точности Р i для запроса i примут вид
           Ri = ai / (ai + ci),   Pi = ai / (ai + bi).

Для получения средних значений коэффициентов
по всем k запросам берем средние арифметические



Еще одна средняя величина получается путем исполь-
зования в качестве критерия суммарного количества
выданных системой релевантных документов по k
запросам, а также суммарного количества отклонен-
ных системой нерелевантных документов. Такие
средние определяются формулой



   Существует еще один показатель — специфич-
ность S, который по одному запросу вычисляется
по формуле S i = d i /(b i + d i ). Специфичность показы-
вает способность системы не выдавать нерелевантные
документы. Введение этого показателя позволяет при
оценке эффективности ИПС учитывать такой важный
параметр, как общий объем документального массива.
   В дополнение к стандартным мерам полноты и
точности, значения которых зависят от размера
множества выданных документов, имеется возмож-
ность использовать показатели, не зависящие от
выданного множества. Одними из таких показателей
являются нормализированные полнота и точность:




где п,— объем множества релевантных документов,
N —объем всего массива, ri—ранг i-го релевантного
документа, когда они расположены в порядке
232