Информационные системы в науке, образовании и бизнесе. Ефремов О.В - 69 стр.

UptoLike

Составители: 

Факт: < идентификатор факта>, < значение факта>, < временной диапазон действия
факта>, <место>, <источник факта>, <оператор>, <статус факта>;
Идентификатор факта: <идентификатор объекта>;
Идентификатор элемента досье – <идентификатор атрибута>, <идентификатор
связи>.
Технологии обработки фактов
Один из наиболее важных, но и наименее достоверных источников информации для выделения фактов
масс-медиа. В связи с большой плотностью потока текстовой информации в современных фактографических
системах интенсивно развивается технология автоматического выделения фактов, относящихся к объектам мо-
ниторинга. Она позволяет в режиме квазиреального времени получить доступ к ретроспективным фондам до-
кументов за десяток лет и получить актуальное "сырое" досье на новые объекты, что практически нереально
при использовании экспертной технологии выделения фактов. В XFiles реализована функция сбора А-фактов
практически изо всех доступных типов открытых источников.
Для последующей оценки достоверности фактов, их обобщения и для формирования
аналитических материалов используется экспертная обработка. Экспертные факты (Э-факты)
вводятся авторизованным пользователем в интерактивном или пакетном режиме.
Для установления связи между объектами системы необходима пара профильных атри-
бутов в связываемых объектах. При наличии факта об определенном типе связи двух объек-
тов в каждый профильный атрибут обоих объектов вводится ссылка на объект viz-a-viz. Этот
процесс может выполняться автоматически и с участием эксперта. Если объектавторого
участника связи нет в базе данных, то, в зависимости от параметров системы, он создается
автоматически либо гипертекстовая ссылка не создается.
В системе рассматриваются два типа связей: симметричные и асимметричные. Симмет-
ричная связь между объектами X и Y создается автоматически путем установления в одном и
том же атрибуте досье каждого из объектов гиперссылки на второй объект. При автоматиче-
ском выделении этого факта из текста первичным объектом связи считается подлежащее, а
вторичнымдополнение. Так, для атрибута Дружественные отношения в досье Персоны для
объекта Орлов может фигурировать факт дружбы с объектом Петров. В этом случае у объек-
та Петров появится симметричный факт и ссылка на объект Орлов в этом же атрибуте.
В случае асимметричной связи автоматическая репликация факта связи производится
между различными атрибутами объектов. Например, при выявлении факта кредитования од-
ним объектом другого для атрибута Сумма выданного кредита одного объекта активируе-
мым будет атрибут Сумма взятого кредита другого.
На рис. 20 представлен пример структуры источников информации, используемых для
ведения досье.
Системы обработки структурированных данных (примеры)
Финансово-экономический Маркетинговые
анализ исследования
A-факты из передач
радио, ТВ
и публикаций
A-факты
из ресурсов
Internet
A-факты из сообщений
информационных
агентств
Э-факты
A
-факты
из подсистемы
data mining
A-факты из документов
системы
документооборота
Автоматический обмен
данными с другими
серверами системы
Связи
Досье