Интеллектуальный анализ данных в менеджменте. Кричевский М.Л. - 198 стр.

UptoLike

Составители: 

198
тельным. К задаче можно подойти с иных позиций: попытаться смо"
делировать искомое отображение непосредственно по обучающим
данным. Преимущество такого подхода заключается в том, что здесь
не требуется обучения, а недостаток в том, что в результате может
получиться очень громоздкая модель, занимающая много памяти и
медленно работающая.
Вероятностные нейронные сети и обобщенно"регрессионные ней"
ронные сети как раз и представляют собой методы такого типа, за"
маскированные под ИНС, предназначенные, соответственно, для за"
дач классификации и регрессии. Первый промежуточный слой в се"
тях этих типов состоит из радиальных элементов. Выходной сигнал
радиального элемента является гауссовой функцией активации с цен"
тром в той точке, которая хранится в данном элементе. В последую"
щих слоях из этих сигналов составляются оценки для плотностей
вероятностей классов (для ВНС) или зависимой переменной регрес"
сии (для ОРНС).
Далее для решения задачи отбора входных переменных будем рас"
сматривать сочетание ВНС и ГА. Такого рода задача может быть реали"
зована с помощью уже упоминавшегося в первом разделе пакета
Statistica Neural Networks. ГА отбора входных данных, работа"
ющий со строками битов, в данной задаче с помощью таких строк созда"
ет маску. Каждая маска определяет, какие из входных переменных дол"
жны использоваться при построении ИНС: «No» означает, что эта пе"
ременная не используется, «Yes» – используется. ГА случайным обра"
зом создает популяцию таких строк, а затем применяет для отбора луч"
ших строк генетические операторы. В качестве решения выбирается
одна из строк последнего поколения.
Для иллюстрации описанного подхода воспользуемся сокращен"
ными данными файла «Credit», приведенным в пакете SNN. Этот
файл содержит девять входных признаков, характеризующих фи"
нансовое состояние заемщика, и одну выходную номинальную пере"
менную «Risk», имеющую два значения: «Bad» и «Good». ИНС обу"
чается на входных образах, формируя на выходе положительное или
отрицательное заключение о состоянии потенциального заемщика.
Обученная сеть, способная к обобщению, дает заключение о степени
риска выдачи кредита новому клиенту. На рис. 3.13 показана часть
исходных данных файла «Credit», которые были разделены на обу"
чающую (150 строк) и контрольную (50 строк) выборки.
Через меню Train–Auxiliary (Обучение – Дополнительно) от"
крываем диалоговое окно Input Feature Selection (Отбор вход"
ных переменных), которое показано на рис. 3.14.