Информационные системы. Бурцева Е.В - 59 стр.

UptoLike

Суть работы АИПС состоит в разбиении множества документов БД тоже на
два подмножества:
подмножество формально релевантных запросу документов (выдаваемых
документов);
подмножество формально нерелевантных запросу документов (невыда-
ваемых документов)
.
Полнота поиска
определяется отношением числа выданных релевантных
документов (
Р
в
) к общему числу релевантных документов массива (
Р = Р
в
+ Р
н
):
нв
в
П
РР
Р
+
= .
Точность поиска
отношение числа выданных релевантных документов
(
Р
в
) к общему числу выданных документов (
О = Р
в
+ Н
в
):
вв
в
НР
Р
Т
+
= .
Специфичность поиска
отношение числа невыданных нерелевантных доку-
ментов (
Н
н
) к общему числу нерелевантных документов (
Н = Н
н
+
Н
в
):
вн
н
НН
Н
С
+
= .
Показатели полноты и точности поиска находятся в обратно пропорцио-
нальной зависимости, т.е. повышение полноты поиска в рамках заданной ИПС
всегда сопровождается снижением точности поиска и наоборот.
Для определения релевантности документов в исходной базе данных ис-
пользуются различные методы, позволяющие оценить число релевантных до-
кументов в БД, не прибегая к анализу всей БД.
1. Случайная выборка некоторой части документов. Определение доли ре-
левантных документов в выборке и аппроксимация полученных данных на всю
БД.
2. Использование запросов, ориентированных на поиск заранее заданных
документов и определение в выдаче доли заданных документов. Этим методом
можно непосредственно оценить полноту поиска.
3. Проведение серии поисков по последовательно модифицируемому запро-
су и определение накапливаемых в процессе модификации запроса релевант-
ных документов выдачи.
2.15. Особенности функционирования документальных ИС
Для реализации основных функций документальных ИС и работы с их ба-
зами данных используются программные средства (пакеты прикладных про-
грамм), отличающиеся друг от друга по мощности и гибкости поиска, но реали-
зующие одни и те же функции.