Интеллектуальные информационные системы. Дубровин А.Д. - 128 стр.

UptoLike

Составители: 

163
моделирующие
интеллектуальные
возможности
человека
,
должны
быть
реализованы
на
компьютерах
, «
понимающих
»
естественный
язык
человека
.
Использование
контекстно
зависимых
языков
при
реализации
САРО
существенно
повысит
эффективность
обучения
таких
систем
,
надежность
,
точность
и
оперативность
распознавания
образов
.
Логично
полагать
,
что
ограниченной
обучающей
выборки
из
объектов
одного
образа
,
недостаточно
,
чтобы
определить
точные
границы
области
этого
образа
.
Действительно
,
область
одного
образа
может
быть
представлена
сколь
угодно
большим
числом
подобластей
,
разбросанных
по
плоскости
координат
.
То
есть
область
одного
образа
может
быть
некомпактной
.
А
это
значит
,
что
построить
непрерывную
функцию
линии
раздела
не
удастся
.
Причина
в
том
,
что
аппроксимация
функции
на
ограниченном
множестве
ее
значений
потребует
введения
определенных
ограничений
на
класс
таких
функций
.
Выбор
же
этих
ограничений
зависит
от
характера
информации
,
необходимой
для
составления
обучающей
выборки
,
которую
следует
иметь
на
этапе
обучения
САРО
.
Именно
такой
информацией
и
является
упомянутая
ранее
гипотеза
о
компактности
области
объектов
одного
образа
.
Здравый
смысл
говорит
нам
,
что
аппроксимация
разделяющей
функции
будет
задачей
тем
более
легкой
,
чем
более
компактны будут области одного образа и чем
большими будут расстояния между такими областями.
Именно
это
интуитивное
представление
и
приводит
к
правомерности
гипотезе компактности
образов
(
ГКО
).
ГКО
не
всегда
удавалось
подтвердить
экспериментально
,
но
все
задачи
,
в
рамках
которых
она
подтверждается
,
находят
простое
решение
.
Подтверждается
и
обратное
-
задачи
,
для
которых
гипотеза
не
может
быть
применена
,
либо
не
имели
решения
,
либо
решались
трудно
и
с
привлечением
дополнительных
ухищрений
.
Известно
,
что
для
опровержения
любой
гипотезы
достаточно
одного
отрицающего
ее
примера
.
И
все
же
привлекательность
ГКО
превратила
ее
в
некую
гарантию
эффективного
решения
задач
распознавания
образов
.
Представим
,
что
существует
некоторое
множество
образов
,
которым
присуще
одно
общее
свойство
,
не
зависящее
ни
от
природы
этих
образов
,
ни
от
их
изображений
,
но
определяющее
только
возможность
каким
-
то
способом
разделить
их
,
обособить
.
В
этом
случае
теоретически
возможно
ставить
задачу
самообучения
САРО
без
привлечения
обучающей
выборки
.
Эту
задачу
можно
неформально
представить
так
:
системе
одновременно
или
последовательно
предъявляются
объекты
без
каких
-
либо
указаний
на
их
принадлежности
к
образам
.
Входное
устройство
системы
отображает
множество
объектов
на
множество
изображений
и
,
используя
некоторое
,
заложенное
в
нее
заранее
свойство
разделимости
образов
,
производит
самостоятельную
классификацию
этих
объектов
.
После
такого
самообучения
САРО
должна
приобрести
способность
к
распознаванию
не
только
уже
знакомых
объектов
(
объектов
из
обучающей
последовательности
),
но
и
тех
,
которые
ранее
системе
не
предъявлялись
.
Теперь
самообучение
системы
распознаванию
(
идентификации
)
объектов
определенного
образа
некоего
множества образов
S
можно
определить
как
процесс
,
в
результате
которого
эта
система
без
обучающей
выборки
приобретает
способность
к
выработке
одинаковых
реакций
на
изображения
объектов
этого
образа
и
способность
к
выработке
различных
реакций
на
изображения
объектов
,
принадлежащих
к
другим
образам
множества
S.
Роль
учителя
при
этом
состоит
лишь
в
подсказке
системе
некоторого
объективного
свойства
,
позволяющего
разделить
множество
S
на
подмножества
,
соответствующие
разным
образам
.
Таким
объективным
свойством
является
свойство
компактности всех образов множества S
.
Наличие
этого
свойства
является
достаточным
условием для автоматической реализации алгоритмов самообучения
САРО
.
Приведенные
рассуждения
позволяют
считать
,
что
базами
знаний
САРО
,
обучающихся
на
примерах
,
являются
обучающие
выборки
реальных
объектов
разных
образов
,
а
для
самообучающихся
систем
базой
знаний
является
формальное
или
натурализованное
представление
объективного
свойства
всего
множества
образов
моделирующие интеллектуальные возможности человека, должны быть реализованы на
компьютерах, «понимающих» естественный язык человека. Использование контекстно –
зависимых языков при реализации САРО существенно повысит эффективность обучения
таких систем, надежность, точность и оперативность распознавания образов.
     Логично полагать, что ограниченной обучающей выборки из объектов одного образа,
недостаточно, чтобы определить точные границы области этого образа. Действительно,
область одного образа может быть представлена сколь угодно большим числом
подобластей, разбросанных по плоскости координат. То есть область одного образа может
быть некомпактной. А это значит, что построить непрерывную функцию линии раздела не
удастся. Причина в том, что аппроксимация функции на ограниченном множестве ее
значений потребует введения определенных ограничений на класс таких функций. Выбор
же этих ограничений зависит от характера информации, необходимой для составления
обучающей выборки, которую следует иметь на этапе обучения САРО. Именно такой
информацией и является упомянутая ранее гипотеза о компактности области объектов
одного образа. Здравый смысл говорит нам, что аппроксимация разделяющей функции
будет задачей тем более легкой, чем более компактны будут области одного образа и чем
большими будут расстояния между такими областями. Именно это интуитивное
представление и приводит к правомерности гипотезе компактности образов (ГКО).
     ГКО не всегда удавалось подтвердить экспериментально, но все задачи, в рамках
которых она подтверждается, находят простое решение. Подтверждается и обратное -
задачи, для которых гипотеза не может быть применена, либо не имели решения, либо
решались трудно и с привлечением дополнительных ухищрений. Известно, что для
опровержения любой гипотезы достаточно одного отрицающего ее примера. И все же
привлекательность ГКО превратила ее в некую гарантию эффективного решения задач
распознавания образов.
     Представим, что существует некоторое множество образов, которым присуще одно
общее свойство, не зависящее ни от природы этих образов, ни от их изображений, но
определяющее только возможность каким-то способом разделить их, обособить. В этом
случае теоретически возможно ставить задачу самообучения САРО без привлечения
обучающей выборки. Эту задачу можно неформально представить так: системе
одновременно или последовательно предъявляются объекты без каких-либо указаний на их
принадлежности к образам. Входное устройство системы отображает множество объектов
на множество изображений и, используя некоторое, заложенное в нее заранее свойство
разделимости образов, производит самостоятельную классификацию этих объектов. После
такого самообучения САРО должна приобрести способность к распознаванию не только
уже знакомых объектов (объектов из обучающей последовательности), но и тех, которые
ранее системе не предъявлялись.
      Теперь самообучение системы распознаванию (идентификации) объектов
определенного образа некоего множества образов S можно определить как процесс, в
результате которого эта система без обучающей выборки приобретает способность к
выработке одинаковых реакций на изображения объектов этого образа и способность к
выработке различных реакций на изображения объектов, принадлежащих к другим образам
множества S. Роль учителя при этом состоит лишь в подсказке системе некоторого
объективного свойства, позволяющего разделить множество S на подмножества,
соответствующие разным образам. Таким объективным свойством является свойство
компактности всех образов множества S. Наличие этого свойства является достаточным
условием для автоматической реализации алгоритмов самообучения САРО.
     Приведенные рассуждения позволяют считать, что базами знаний САРО,
обучающихся на примерах, являются обучающие выборки реальных объектов разных
образов, а для самообучающихся систем базой знаний является формальное или
натурализованное представление объективного свойства всего множества образов


                                                                                  163