ВУЗ:
Составители:
Рубрика:
Поиск с помощью просмотра индексов.
Большинство современных систем позволяют пользователю просматривать
части файла инвертированных индексов, организованного в алфавитном поряд-
ке. При этом пользователь может видеть слова или фразы, по которым можно
проводить поиск, их вариации (присутствующие в неконтролируемых полях), и
таким образом найти точную фразу или её форму для ввода при поиске по поф-
разово проиндексированному полю. Эта функция помогает сократить количе-
ство ложно выданных из-за использования усечения или поиска с помощью по-
словного индексирования документов.
Многие системы при выдаче алфавитного списка индексов для каждого
термина дополнительно указывают количество записей, содержащих искомый
термин (postings). Это помогает при формировании стратегии поиска. Некото-
рые системы позволяют перемещение вверх или вниз по списку, другие требу-
ют от пользователя указать пределы выдаваемого списка, а некоторые выводят
лишь ограниченное количество терминов сверху и снизу указанного термина.
Поиск по словарной близости (proximity searching).
Он является особенно мощной функцией для пословно проиндексирован-
ных полей.
Поиск по словарной близости позволяет пользователю посткоординировать
фразы из пословно проиндексированных полей, таких как "название" и "рефе-
рат". Эта функция становится возможной из-за наличия информации о позици-
ях при каждом из терминов – "входов" в файле инвертированных индексов. Эта
информация представляет собой указание на поле и положение данного терми-
на в этом поле. Пользователь, например, может сделать запрос на слово БИБ-
ЛИОТЕЧНАЯ, после которого сразу же идёт слово АВТОМАТИЗАЦИЯ в по-
словно или смешанно проиндексированном поле. Система в этом случае ис-
пользует информацию о позициях для воссоздания фразы, даже если каждое
слово представляет собой отдельный инвертированный индекс – "вход". Функ-
ции поиска по словарной близости в каждой системе могут быть разными.
Поиск с помощью булевых логических операторов.
Одним из способов удовлетворения сложных запросов является использо-
вание булевых логических операторов AND, OR и NOT. Они являются эквива-
лентами пересечения, объединения и исключения. Эти три оператора в той или
иной форме можно найти практически во всех информационно-поисковых сис-
темах. С помощью оператора AND поиск сужается организацией набора, чьи
элементы являются общими для обоих наборов искомых компонентов. Напри-
мер, выражение МОНИТОР AND ПРИНТЕР будет выполняться с набором до-
кументов, содержащим термин МОНИТОР, и другим набором, содержащим
термин ПРИНТЕР. В результате будут выданы записи, каждая из которых со-
держит и термин МОНИТОР, и термин ПРИНТЕР. Записи, содержащие толь-
ко термин МОНИТОР, выданы не будут, так же как и записи, содержащие
только термин ПРИНТЕР.
Напротив, при формулировании выражения МОНИТОР OR ПРИНТЕР бу-
дут выданы документы, содержащие хотя бы один из указанных терминов.
Страницы
- « первая
- ‹ предыдущая
- …
- 61
- 62
- 63
- 64
- 65
- …
- следующая ›
- последняя »