Интеллектуальный анализ данных в менеджменте. Кричевский М.Л. - 47 стр.

UptoLike

Составители: 

47
– бинарная;
– кодировка 1"из"M.
При бинарном представлении в выходном слое сети имеется один
нейрон, принимающий одно из двух значений (0 или 1). В такой ко"
дировке происходит разделение данных на два класса.
При кодировке вида 1 – из – M на каждое состояние выделяется
один нейрон, так что каждое конкретное состояние представляется
как 1 на соответствующем месте и 0 во всех других положениях, на"
пример, для четырех классов имеем такие значения выходных ячеек:
(1 0 0 0), (0 1 0 0), (0 0 1 0), (0 0 0 1).
Каждый из выходных нейронов сети будет содержать числовые
значения в интервале от 0 до 1. Для определения класса по набору
выходных значений сеть должна решить, достаточно ли близки они
к нулю или единице. При нахождении такого решения устанавлива"
ются пороговые значения принятия и отвержения решений. Эти по"
роговые значения можно корректировать, чтобы заставить сеть быть
более или менее решительной при объявлении класса. На практике
обычно не добиваются полного совпадения выходного значения сети
с 0 или 1. Расхождение между требуемым и действительным выхода"
ми в пределах 5% вполне достаточно для решения большинства прак"
тических задач, т. е. пороговые значения при бинарном представле"
нии можно принять равными, соответственно, 0,95 и 0,05.
При решении задачи классификации необходимо обратить вни"
мание на нежелательную возможность переобучения сети. Это яв"
ление проще всего продемонстрировать на примере аппроксима"
ции с помощью полиномов. Графики полиномов могут иметь раз"
личную форму, и при более высокой степени многочлен имеет дос"
таточно сложную форму. По имеющимся опытным данным (гра"
фику зависимости полинома) подбирается модель для объяснения
результатов эксперимента. Можно выбрать сложную модель, ко"
торая будет точно проходить через все экспериментальные точки,
но при такой модели теряется искомая зависимость. Полином низ"
кого порядка может быть недостаточно гибким для аппроксима"
ции данных, но способен уловить общую тенденцию требуемой за"
висимости. ИНС при обучении сталкивается с такой же пробле"
мой. Сети с большим числом весов моделируют более сложные фун"
кции и, следовательно, склонны к переобучению. Вместо способ"
ности к обобщению, для чего и обучается нейронная сеть, можно
получить такую нежелательную ситуацию.
Для исключения подобных явлений применяется контрольная
проверка, при которой используются данные, не предъявляемые сети