Введение в информационно-поисковые системы - 32 стр.

UptoLike

Составители: 

до нижнего уровня. Поисковая машина в соответствии с этим запросом обращается
к базе данных и формирует список результатов поиска.
Система каталогов классификационной ИПС обычно разрабатывается людьми.
Принципы и методы создания классификаторов подробно описаны в разделе 2. Эти
положения применимы и при автоматической генерации классификаторов для неко-
торого множества документов. Однако полученные таким образом системы класси-
фикации трудны для восприятия массового пользователя и не всегда обеспечивают
адекватное распределение документов.
Аналогичные трудности встречаются и при использовании средств классифика-
ции, которые также могут быть ручными и автоматическими. В условиях непрерыв-
ного роста объема информации автоматическое распределение документов по срав-
нительно небольшому фиксированному набору каталогов приводит к тому, что число
документов в конечных рубриках резко увеличивается. Эффективность поиска сни-
жается, так как пользователь, находясь в конечном разделе классификатора, не мо-
жет повысить точность, сужая число выдаваемых документов. Если динамически
добавлять в классификатор новые разделы, то рано или поздно его структура станет
настолько сложной, что использовать систему будет невозможно [].
В то же время проведенная коллективом специалистов систематизация доку-
ментов обеспечивает предсказуемый с точки зрения пользователей порядок разме-
щения документов в каталоге [].
Ручная разработка классификатора определяет один из главных недостатков
классификационных ИПС. Различные области человеческой деятельности и знаний
могут получить разную оценку своей относительной важности у разных групп разра-
ботчиков. Глубина проработки и ширина охвата того или иного раздела классифика-
тора часто бывает разной в различных ИПС, что обуславливает трудности перехода
пользователей от одной системы к другой.
Описанная проблема свойственна как глобальным, так и локальным ИПС клас-
сификационного типа. Если пользователь не имеет четкого представления об ин-
тересующей его предметной области, найти необходимые документы будет доволь-
но трудно. Однако при этом классификатор может помочь сформулировать инфор-
мационную потребность или расширить запрос синонимическими терминами [].
Ручные методы составления классификаторов и распределения по ним доку-
ментов занимают по сравнению с автоматическими гораздо больше времени и име-
ют горазда большую стоимость. Это оправдывает себя лишь в небольших локаль-
ных поисковых системах. Глобальные ИПС сети Интернет в состоянии классифици-
ровать только крайне малую часть всех документов сети. Поэтому основное досто-
30