Основы теории систем и системного анализа. Матвеев Ю.Н. - 26 стр.

UptoLike

Составители: 

26
есть оценить качество обучения. К обучающей и контрольной выборкам
предъявляются определённые требования. Важно, чтобы объекты
экзаменационной выборки не входили в обучающую выборку (иногда,
правда, это требование нарушается, если общий объём выборок мал и
увеличить его либо невозможно, либо чрезвычайно сложно). Обучающая и
экзаменационная выборки должны достаточно полно представлять
генеральную совокупность (
гипотетическое множество всех возможных
объектов каждого образа). Например, при обучении системы медицинской
диагностики в обучающей и контрольной выборках должны быть
представлены пациенты различных половозрастных групп, с различными
анатомическими и физиологическими особенностями, сопутствующими
заболеваниями и т.д.
Перечисленные выше методы всегда применяются при наличии
априорной информации об объектах и классах или после
первоначальной
классификации, когда получена предварительная структура системы. Они
используют максимум дополнительной информации и обеспечивают
высокую надежность и относительную простоту классификации в случае
небольшого количества линейно разделяемых классов. Однако при
увеличении числа классов и признаков объектов становятся
труднореализуемыми и малопригодными. Кроме того, в случае линейно
неразделяемых классов сложность реализации данных методов
заставляет
искать новые пути решения поставленной проблемы.
Определенные ограничения на процесс построения дискрими-
нантных функций накладывает размерность обучающей выборки.
Что касается вычислительных ресурсов, требуемых для реализации
методов дискриминантного анализа, то они вполне приемлемы и
определяются в основном размерностью обучающей выборки и
количеством классовых областей, которые в свою очередь определяют
число разделяющих
функций или решающих правил.
1.8. Математический аппарат
для разработки алгоритма классификации
1.8.1. Основные критерии кластеризации
Разбиение объектов на кластеры всегда осуществляется в
соответствии с некоторым, заранее выбранным критерием качества.
Основными критериями качества, применяемыми в кластерном
анализе, являются:
внутригрупповая сумма квадратов отклонений;
дисперсия объектов внутри класса;
расстояние между объектами класса;
мера сходства объектов кластера и другие.
Критерий качества кластеризации в той или иной мере отражает
неформальные требования: