ВУЗ:
Составители:
Рубрика:
тельные совпадения для тех терминов запроса и документа, которые отнесены к од-
ним и тем же классам тезауруса. Сами эти термины могут быть и различными [].
В ИПС в основном применяется два типа классификаций []: терминов и доку-
ментов.
Целью классификации терминов является группировка терминов в синонимиче-
ские классы в расчете повысить вероятность совпадения терминов запроса и доку-
мента. Классификация документов способна улучшить результаты и оперативность
поиска за счет обращения только к определенным частям информационного масси-
ва. Эти два типа классификаций взаимосвязаны: присваиваемые документам терми-
ны при формировании их поисковых образов служат основой для построения
классов, получаемых в результате группировки документов.
При хорошей классификации терминов обычно удается сгруппировать различ-
ные низкочастотные родственные термины в общие классы тезауруса. Термины,
входящие в один класс, могут заменять друг друга в процессе поиска, следователь-
но, можно ожидать улучшения полноты выдачи. Классификации документов позво-
ляют сузить область поиска до наиболее существенных классов документов и обес-
печить высокую точность. При совместном использовании систематизированных
массивов данных и тщательно проработанного тезауруса можно получить высокие
показатели и по полноте, и по точности поиска.
В основе любой классификации лежит принцип распределения информацион-
ных объектов (терминов или документов) по некоторым классам. Совокупность таких
классов называется классификатором, а сами классы – разделами классификатора,
или рубриками. Классификаторы обычно разрабатываются вручную []. Примерами
классификаций могут служить общепринятые библиотечные классификации УДК
(универсальная десятичная классификация) и ББК (библиотечно-библиографиче-
ская классификация) [].
Класс определяется как множество терминов, обозначающих некоторую пред-
метную область. В процессе классификации каждому информационному объекту
для обозначения его смыслового содержания (тематики) приписывается идентифи-
катор какого-либо класса [].
Разбиение на предметные классы или рубрики должно быть предсказуемым, а
подчиненные тематические классы легко отличимы от вышестоящих. От четкости та-
кой иерархической структуры зависит эффективность регулирования глубины поиска
путем расширения или сужения запроса.
Маловероятно, чтобы можно было найти такую структуру, которая могла бы
удовлетворять этим требованиям. Строго заданные иерархические отношения меж-
12
Страницы
- « первая
- ‹ предыдущая
- …
- 12
- 13
- 14
- 15
- 16
- …
- следующая ›
- последняя »