ВУЗ:
Составители:
Рубрика:
111
бого хранилища есть список лиц, ответственных за наполнение и работу репо-
зитария. Это сотрудники организации, которые занимаются публикацией ре-
сурсов. Их задача – наполнение репозитария новыми ресурсами и обеспечение
многопользовательского доступа к ним. В нашем случае, это может быть отдел
разработки программного обеспечения, наполняющий репозитарий своими ре-
зультатами в виде исходных кодов. Основной вопрос в их работе: «Где опубли-
ковать тот или иной ресурс?».
Также у хранилища есть пользователи, для которых самые востребован-
ные функции репозитария – это доступ к ресурсам и их поиск. Их основной во-
прос: «Где найти тот или иной ресурс?».
На определенной стадии развития хранилища наступает момент, когда
решение этих вопросов начинает отнимать заметное время. Действительно, уже
два десятка каталогов на файл-сервере заставляют задуматься, куда лучше по-
местить ресурс. Пользователь, в свою очередь, задумывается, где искать ресурс.
Успешная реализация хранилища должна свести к минимуму время на решение
этих вопросов.
5.2. Реализация интеллектуального хранилища
5.2.1. Публикация ресурсов
Рассмотрим проблему подробнее. По сути, структура каталогов отражает
структуру категорий хранимой информации. А значит, задача размещения ре-
сурса по каталогам есть задача классификации ресурса. При классификации ре-
сурса должны быть решены следующие вопросы. Во-первых, должно быть со-
ставлено дерево категорий. В нашем случае это дерево каталогов на файл-
сервере, составленное группой публикаторов. Во-вторых, требуется опреде-
лить, какой (каким) из этих категорий, ресурс более всего соотвествует. От ре-
шения этих вопросов напрямую зависит результат классификации, а значит, и
последующего поиска ресурса. Но результат решения этих вопросов сильно за-
висит от субъективных представлений эксперта о предметной области. В случае
независимой публикации ресурсов из одной предметной области разными
людьми, они могут оказаться в разных категориях. Кроме того, даже у одного
человека эти представления могут меняться с течением времени. Это неминуе-
мо скажется на качестве и скорости поиска нужного ресурса конечным пользо-
вателем.
Таким образом, мы не можем полагаться на субъективность человека, ко-
гда речь идет о крупном информационном хранилище с большими объемами
поступающих ресурсов. Нужно какое-то унифицированное представление о со-
ответствии ресурсов дереву категорий.
Предлагаемым решением проблемы построения дерева категорий являет-
ся машинная кластеризация ресурсов. При кластеризации мы полагаемся на ги-
потезу о том, что смысловое содержание текста можно извлечь из статисти-
Страницы
- « первая
- ‹ предыдущая
- …
- 110
- 111
- 112
- 113
- 114
- …
- следующая ›
- последняя »
