Интеллектуальные информационные системы. Дубровин А.Д. - 20 стр.

UptoLike

Составители: 

24
Непротиворечивость. Разные знания об одном и том же объекте не должны
приводить к противоречивому или абсурдному пониманию сущности этого объекта.
Однако для многих систем сбора знаний это изначально не так на вход хранилища
знаний может поступать разноречивая информация. Задача собирателя знаний -
обнаружить противоречия и разрешить их на этапе сбора знаний либо присвоить разным
элементам данных, составляющих знания, различную оценку достоверности.
Достоверность. Получая и используя знания, хочется иметь представление о том,
насколько они достоверны. Хорошее хранилище знаний (учебник или база знаний)
должно содержать достоверную, соответствующую истинному состоянию предметной
области систему знаний о ее объектах и отношениях между ними. Это означает, что
поддержание базы знаний в актуальном состоянии важнейшая функция
администраторов базы знаний.
Обрабатываемость. Для того, чтобы знания не оставались вещью в себе, база
знаний, как информационная модель предметной области, должна быть построена с
учетом возможности генерации достаточно сложных процедур обработки знаний. Эта
возможность существенно зависит не только от мощности процедур логической и
математической обработки знаний, имеющихся в составе системы, но и от выбранной
структуры описания знаний. Наиболее универсальным способом представления знаний о
свойствах сущностей ПО и отношениях между ними является предикатно-актантная (П-А)
структура в сочетании с языком элементарных триад. Сетевая организация базы знаний на
этой основе обеспечивает принцип независимости структуры базы знаний от
потребностей процедур их обработки (анализа и синтеза) и независимость процедур
обработки знаний от изменения логической структуры базы знаний и от изменения ее
физической структуры.
Граница между информацией (данными) и знаниями - нечеткая и зависит от
воспринимающего субъекта. Для одного человека легкий намек может стать знанием или
источником знаний, а для другого даже мегабайты информации останутся втуне, так и не
превратившись в знания. Это говорит о том, что существует зависимость качества знаний
от наличия и мощности процедур обработки. Наглядный пример информации, не
превратившейся в знание, - чтение человеком текста, написанного на языке, которого
этот человек совершенно не знает. Наличие информации в таком тексте - бесспорно,
однако в знание ее превратить невозможно, если не знать языка, или очень трудоемко,
если пользоваться словарем. Перевод такого текста с помощью компьютерной системы
автоматического перевода - типичный пример более эффективной, хотя и не
совершенной процедуры извлечения знаний. Если перевод будет сделан человеком,
знающим в совершенстве язык и точно понимающим содержание текста, то есть надежда,
что знания, в нем содержащиеся, будут извлечены полностью.
Как возникает потребность в извлечении знаний из информации? Часто текст и на
родном языке в силу разных причин может быть настолько же трудным для извлечения
знаний, как и на чужом. Характерной приметой времени является рост объемов
компьютерной информации, что создает огромную потребность в извлечении из нее
необходимых знаний. Аналитические службы многих фирм ежедневно получают в
электронном виде до 10 15 Мбайт текстовой информации и должны дать свое
заключение по ней. Нетрудно представить, как напряженно работают такие службы при
ограниченной численности сотрудников и жестких сроках обработки. Следует отметить,
что работа по превращению информации в знания стоит не дешево. В Internet размещается
огромное количество информации и почти вся она предоставляется бесплатно, а вот
знаний в ней - немного. Показательно, что в Internet существует довольно много служб,
продающих структурированную информацию (знания) - аналитические обзоры,
отсортированную и препарированную прессу и т. п. Эти же данные, но в разбросанном
      Непротиворечивость. Разные знания об одном и том же объекте не должны
приводить к противоречивому или абсурдному пониманию сущности этого объекта.
Однако для многих систем сбора знаний это изначально не так — на вход хранилища
знаний может поступать разноречивая информация. Задача собирателя знаний -
обнаружить противоречия и разрешить их на этапе сбора знаний либо присвоить разным
элементам данных, составляющих знания, различную оценку достоверности.
      Достоверность. Получая и используя знания, хочется иметь представление о том,
насколько они достоверны. Хорошее хранилище знаний (учебник или база знаний)
должно содержать достоверную, соответствующую истинному состоянию предметной
области систему знаний о ее объектах и отношениях между ними. Это означает, что
поддержание базы знаний в актуальном состоянии – важнейшая функция
администраторов базы знаний.
      Обрабатываемость. Для того, чтобы знания не оставались вещью в себе, база
знаний, как информационная модель предметной области, должна быть построена с
учетом возможности генерации достаточно сложных процедур обработки знаний. Эта
возможность существенно зависит не только от мощности процедур логической и
математической обработки знаний, имеющихся в составе системы, но и от выбранной
структуры описания знаний. Наиболее универсальным способом представления знаний о
свойствах сущностей ПО и отношениях между ними является предикатно-актантная (П-А)
структура в сочетании с языком элементарных триад. Сетевая организация базы знаний на
этой основе обеспечивает принцип независимости структуры базы знаний от
потребностей процедур их обработки (анализа и синтеза) и независимость процедур
обработки знаний от изменения логической структуры базы знаний и от изменения ее
физической структуры.
      Граница между информацией (данными) и знаниями - нечеткая и зависит от
воспринимающего субъекта. Для одного человека легкий намек может стать знанием или
источником знаний, а для другого даже мегабайты информации останутся втуне, так и не
превратившись в знания. Это говорит о том, что существует зависимость качества знаний
от наличия и мощности процедур обработки. Наглядный пример информации, не
превратившейся в знание, - чтение человеком текста, написанного на языке, которого
этот человек совершенно не знает. Наличие информации в таком тексте - бесспорно,
однако в знание ее превратить невозможно, если не знать языка, или очень трудоемко,
если пользоваться словарем. Перевод такого текста с помощью компьютерной системы
автоматического перевода -      типичный пример       более эффективной, хотя и не
совершенной процедуры извлечения знаний. Если перевод будет сделан человеком,
знающим в совершенстве язык и точно понимающим содержание текста, то есть надежда,
что знания, в нем содержащиеся, будут извлечены полностью.
       Как возникает потребность в извлечении знаний из информации? Часто текст и на
родном языке в силу разных причин может быть настолько же трудным для извлечения
знаний, как и на чужом. Характерной приметой времени является рост объемов
компьютерной информации, что создает огромную потребность в извлечении из нее
необходимых знаний. Аналитические службы многих фирм ежедневно получают в
электронном виде до 10 – 15 Мбайт текстовой информации и должны дать свое
заключение по ней. Нетрудно представить, как напряженно работают такие службы при
ограниченной численности сотрудников и жестких сроках обработки. Следует отметить,
что работа по превращению информации в знания стоит не дешево. В Internet размещается
огромное количество информации и почти вся она предоставляется бесплатно, а вот
знаний в ней - немного. Показательно, что в Internet существует довольно много служб,
продающих структурированную информацию (знания) -              аналитические обзоры,
отсортированную и препарированную прессу и т. п. Эти же данные, но в разбросанном


                                                                                   24