Информационные системы. Бурцева Е.В - 62 стр.

UptoLike

логическом взаимоотношении и возможность изменения запроса на основе
промежуточных результатов. Информационные потребности часто очень слож-
но сформулировать, и выдаваемая информация может быть разного уровня по-
лезности. С такого рода потребностями поможет справиться логическая гиб-
кость. Для решения подобных вопросов в среде документальных систем БД бы-
ли найдены несколько путей получения или выдачи релевантной информации.
Поисковые функции документальных ИС.
Основные поисковые функции включают в себя: усечение (truncation), воз-
можность просмотра на экране файла инвертированных индексов, поиск по
словарной близости корневому родству (proximity searching), с помощью бу-
левых операторов, создание наборов (set building) и пошаговое сужение области
поиска (stepwise refinement), поиск по размеру (range searching) и поиск по
сравнению (comparison searching), а также возможность заранее определять по-
ля, по которым проводится поиск. Приведённые ниже поисковые функции счи-
таются стандартными и находят применение в работе практически с любой тек-
стовой БД.
Поиск с помощью усечения.
Большинство систем позволяют пользователю использовать усечение тер-
минов для поиска всех терминов или фраз, которые начинаются с одного опре-
делённого набора букв. Такая функция обычно задаётся системе с помощью
специального символа усечения. Таким образом, помещая символ усечения по-
сле набора букв ПРАВО, пользователь даёт системе команду найти входы ин-
вертированных индексов ПРАВОВОЙ, ПРАВОПРИМЕНИТЕЛЬНЫЙ и другие
(символ усечения различен в разных системах, но обычно это символы ?, #, *, и
/). В некоторых системах можно найти и другие вариации усечения. Левосто-
роннее усечение не используется всеми системами, но в некоторых случаях оно
может оказаться необходимым (например, в химической БД).
Чаще встречается функция определения максимальной длины термина или
набора букв (например, для выдачи терминов КОМПЬЮТЕР, КОМПЬЮТЕРА,
а не КОМПЬЮТЕРИЗАЦИЯ или КОМПЬЮТЕРНЫЙ). Вставной символ неоп-
ределённости, иногда называемый internal wildcard character, используется там,
где необходима замена символов (например, WOM*N). Некоторые системы
поддерживают такой символ неопределённости для замены некоего набора
букв в середине слова, например при выражении ПРИВ*ТЬ будут выданы
ПРИВЫКАТЬ, ПРИВЫКНУТЬ и любое другое слово, начинающееся на ПРИВ
и заканчивающееся на ТЬ, например, ПРИВИНТИТЬ.
Использование усечения имеет особое значение для пофразово проиндекси-
рованных полей, поскольку это позволяет пользователю получить необходимые
записи без необходимости знать фразы целиком. Используя усечённый поиск
автора ПЕТРОВ, можно найти все записи, содержащие автора с фамилией
ПЕТРОВ, так как не будет необходимости вводить пробелы, знаки пунктуации
или инициалы таким образом, как это требуется при пофразовом индексирова-
нии, так как все они будут следовать за символом усечения.