ВУЗ:
Составители:
Рубрика:
пользователя и описана общая схема процесса поиска. Далее анализируются ин-
формационные массивы и их представление в ИПС, процессы индексирования и
взвешивания терминов. Рассматривается порядок хранения индексированных доку-
ментов. В части 2 описываются основные модели и алгоритмы поиска информации в
ИПС, а также один из традиционных методов анализа документов – классификация.
Перечисляются главные критерии эффективности ИПС и способы их оценки. В за-
ключении описывается архитектура и состав современных ИПС, работающих в сети
Интернет.
Изложение материала предполагает, что студенты знакомы с матричной алге-
брой и теорией вероятностей, с основами математической логики, теорией инфор-
мационных систем и основами теории баз данных, основами методологии тестиро-
вания и оценки систем, а также с основами Интернет-технологий.
1. Основные принципы построения ИПС
1.1. Понятия и определения
Информационный поиск – это отрасль знания, которая занимается представле-
нием, хранением и доступом к информационным ресурсам. Теория информационно-
го поиска оперирует несколькими ключевыми понятиями, определения которых даны
ниже.
Информационный ресурс – это любой материальный объект, который фиксиру-
ет или подтверждает какие-либо знания и может быть включен в определенное со-
брание. По форме различают текстовые (книги, журналы, рукописи), графические
или изобразительные (чертежи, схемы, графики, планы, карты, диаграммы), аудио-
визуальные (звукозаписи, видеозаписи, фильмы) информационные ресурсы [].
Наряду с информационным ресурсом, в информационном поиске также исполь-
зуется понятие «документ». Под документом чаще всего понимается содержательно
законченный текстовый информационный ресурс, который можно каким-либо об-
разом уникально идентифицировать. ИПС оперируют электронными документами, т.
е. представлениями документов на машиночитаемых носителях в ЭВМ [].
С понятием документа тесно связаны метаданные и суррогаты. Метаданные
(метаинформация) – это структурированная информация о документе, например,
библиографические сведения, информация о качестве документа, отзывы других
пользователей. Под суррогатом понимают представление документа в виде заголов-
ка, имени автора, аннотации, ключевых слов и т. д. [].
6
Страницы
- « первая
- ‹ предыдущая
- …
- 4
- 5
- 6
- 7
- 8
- …
- следующая ›
- последняя »