Математические методы в библиотечной работе. Елизаров А.М - 230 стр.

UptoLike

Составители: 

Рубрика: 

способность системы выдавать все релевантные до-
кументы; б) точность поиска, т. е. способность
системы задерживать все нерелевантные запросу
документы; в) время с момента поступления запроса
в систему до выдачи ответа; г) форма представления
выдачи, влияющая на возможность использования
выданных материалов пользователями; д) полнота
массива, т. е. степень охвата всех релевантных доку-
ментов, интересующих пользователей.
Рассмотрим вопрос об определении показателей
точности, полноты и потерь на базе некоторой вы-
борочной совокупности. При этом нужно решить
три задачи:
1) что представляют собой параметры генеральной
совокупности;
2) как объединить результаты нескольких выборок
(когда поискпо нескольким запросам), чтобы по
лучить оценку с максимальным правдоподобием,
несмещенную, с минимальной дисперсией;
3) какова достоверность оценки.
Используем следующую модель ИПС. Система
может как отыскивать, так и не отыскивать ответы,
пользователь оценивает ответы как релевантные или
нет. На выборочном пространстве запросов вводим
случайные величины А количество релевантных
запросу ответов, Вколичество выданных на запрос
ответов, Сколичество выданных релевантных от-
ветов.
С точки зрения пользователя, ИПС должна опи-
сываться следующими параметрами генеральной со-
вокупности:
1. Суммарная вероятность выдачи релевантного
ответа (полнота поиска).
2. Суммарная вероятность релевантности найден
ного ответа (точность).
3. Суммарная вероятность выдачи нерелевантного
ответа (параметр потерь).
Проведенные эмпирические исследования говорят,
что распределение случайных величин А, В, С не яв-
ляется пуассоновским. Более подходящим для про-
цесса поиска представляется отрицательное биноми-
нальное распределение, т. к. ответы скорее имеют
тенденцию группироваться в четкие области данных,
чем появляться случайно. Экспериментальные данные
230
способность системы выдавать все релевантные до-
кументы; б) точность поиска, т. е. способность
системы задерживать все нерелевантные запросу
документы; в) время с момента поступления запроса
в систему до выдачи ответа; г) форма представления
выдачи, влияющая на возможность использования
выданных материалов пользователями; д) полнота
массива, т. е. степень охвата всех релевантных доку-
ментов, интересующих пользователей.
    Рассмотрим вопрос об определении показателей
точности, полноты и потерь на базе некоторой вы-
борочной совокупности. При этом нужно решить
три задачи:
   1) что представляют собой параметры генеральной
совокупности;
   2) как объединить результаты нескольких выборок
(когда поиск — по нескольким запросам), чтобы по
лучить оценку с максимальным правдоподобием,
несмещенную, с минимальной дисперсией;
   3) какова достоверность оценки.
   Используем следующую модель ИПС. Система
может как отыскивать, так и не отыскивать ответы,
пользователь оценивает ответы как релевантные или
нет. На выборочном пространстве запросов вводим
случайные величины А — количество релевантных
запросу ответов, В — количество выданных на запрос
ответов, С — количество выданных релевантных от-
ветов.
   С точки зрения пользователя, ИПС должна опи-
сываться следующими параметрами генеральной со-
вокупности:
   1. Суммарная вероятность выдачи релевантного
ответа (полнота поиска).
   2. Суммарная вероятность релевантности найден
ного ответа (точность).
   3. Суммарная вероятность выдачи нерелевантного
ответа (параметр потерь).
   Проведенные эмпирические исследования говорят,
что распределение случайных величин А, В, С не яв-
ляется пуассоновским. Более подходящим для про-
цесса поиска представляется отрицательное биноми-
нальное распределение, т. к. ответы скорее имеют
тенденцию группироваться в четкие области данных,
чем появляться случайно. Экспериментальные данные
230