Интеллектуальный анализ данных в менеджменте. Кричевский М.Л. - 53 стр.

UptoLike

Составители: 

53
параметрические модели противоположны параметрическим. В пос"
ледних моделях обычно имеется некоторая формула, связывающая
изучаемое явление или процесс с внешней средой. Непараметричес"
кие модели аппроксимируют множество соотношений между вход"
ными и выходными переменными. Например, ИНС, обучаемые мето"
дом обратного распространения ошибки, способны аппроксимиро"
вать почти любое соотношение между входными и выходными пе"
ременными, что подчеркивает мощность нейронных сетей. По суще"
ству, построение сети эквивалентно выводу математической формулы.
Перейдем к обсуждению данных, которые могут быть использова"
ны для обучения и проверки нейронной сети. Обучающая выборка
применяется для разработки нейросетевой модели, т. е. для опреде"
ления значений весов, при которых достигается минимальная ошиб"
ка между требуемым и выходным сигналами (в частности, для обуче"
ния с «учителем»). Тестовая выборка необходима для того, чтобы
удостовериться в обобщающих свойствах сети и в работоспособнос"
ти последней с данными, не участвовавшими в обучении. (Иногда
перед началом работы с обученной сетью используется еще провероч"
ная выборка для оценки действительных характеристик нейросете"
вой модели в условиях окружающей среды).
Общая процедура разработки нейронных сетей заключается в рас"
щеплении исходных данных на обучающее и тестовое множества.
Обычно 2/3 данных используются для обучения, 1/3 – для тестиро"
вания. Основное требование к этим множествам состоит в том, чтобы
эти выборки были репрезентативны, т. е. правильно отражали весь
процесс, из которого извлекаются данные.
Процедура выборки – это снижение популяции данных таким об"
разом, чтобы удовлетворить ряду критериев. Такие критерии вклю"
чают в себя уменьшение стоимости анализа, ускорение времени обра"
ботки и т. п. Традиционные выборки удовлетворяют общим крите"
риям изменением количества наблюдений так, что статистические
свойства выборки и популяции (генеральной совокупности) остают"
ся похожими. Однако при формировании выборки для нейронных
сетей важно, чтобы данные извлекались пропорционально обучаю"
щей сложности.
Деление на обучающую и тестовую выборки требуют, прежде все"
го, прямонаправленные сети. Обучающая выборка – это множество,
с помощью которого сеть итеративным образом снижает ошибку меж"
ду реальным выходом сети и требуемым выходом. При разработке
выборочной стратегии для ускорения нейросетевого моделирования
создатели сети заинтересованы в снижении объема обучающей вы"