Введение в информационно-поисковые системы - 6 стр.

UptoLike

Составители: 

менты, чьи наборы терминов точно совпадают с соответствующими комбинациями
терминов запроса.
Поисковые образы запросов связывают термины с помощью булевых операто-
ров ("И" "AND", "ИЛИ" "OR", НЕ" "AND NOT"). Эти операции производятся
над множествами документов, содержащих тот или иной термин, определенный
запросом. Для обозначения объединения множеств ("ИЛИ" в запросе) применяется
символ
, пересечения множеств ("И" в запросе)
, разности множеств ("И НЕ" в
запросе) –
\
.
Например, оператор "И", соединяющий два термина запроса, означает следую-
щее. Из множества всех документов нужно сначала выбрать два подмножества.
Одно из них содержит первый термин запроса, а другое – второй. Затем определяет-
ся общая часть (пересечение) этих подмножеств, то есть те документы, в состав ко-
торых одновременно входят и первый, и второй термины из запроса.
Рассмотрим, например, такой запрос:
(((Microsoft and Word) or (Microsoft and Excel))
and Macintosh) and not Windows
В данном случае выражение на ИПЯ означает следующее: нужно найти все до-
кументы, которые одновременно содержат либо сочетание "Microsoft Word", либо со-
четание "Microsoft Excel", а также содержат слово "Macintosh", но не содержат слово
"Windows".
Этот запрос можно разбить на две части:
1. Microsoft and Word and Macintosh and not Windows
2. Microsoft and Excel and Macintosh and not Windows
Выполнение первого запроса происходит в два этапа. Сначала находятся все
документы, содержащие термины "Microsoft", "Word" и "Macintosh". Затем из найден-
ных документов отсеиваются те, которые содержат слово "Windows". Второй запрос
выполняется аналогично. В конце производится объединение результатов работы
первой и второй частей исходного запроса.
Часто пользователь строит свой запрос, не используя каких-либо логических
операторов, и просто перечисляет ключевые слова. В таком случае обычно предпо-
лагается, что все термины соединены логической операцией "И".
В некоторых поисковых системах вместо булевых операторов язык запросов
позволяет использовать различные знаки. Так, знак "+" эквивалентен оператору "И",
знак "-" – оператору "И-НЕ" и т. д.
В процессе поиска из исходного информационного массива выделяется часть,
которая содержит найденные документы, соответствующие комбинациям терминов
4