Основы теории систем и системного анализа. Матвеев Ю.Н. - 24 стр.

UptoLike

Составители: 

24
распознающих машин, основанных на вычислении коэффициента подобия,
практически невозможно без дополнительных упрощений.
1.7.2. Кластерный анализ
Кластерный анализряд математических методов многомерного
анализа, позволяющих на основе множества показателей, характеризующих
ряд объектов, сгруппировать их в классы (кластеры) таким образом, чтобы
объекты, входящие в один класс, были более однородными, сходными с
объектами, входящими в
другие классы.
Кластерный анализ позволяет выявить внутреннюю структуру
распределения многомерных объектов по совокупности показателей. Он
отвечает на следующие вопросы: относятся ли все наблюдения к одной
совокупности (однородная выборка), или же выборка неоднородная, т.е.
данные взяты из разных совокупностей (кластеров); сколько различных
кластеров и какие наблюдения относятся к какому кластеру?
Тем самым
появляется возможность составлять однородные выборки объектов для
дальнейшего статистического анализа.
Применяя методы кластерного анализа, можно решать такие задачи
классификации:
первоначальная классификация, которая проводится с целью
составления априорного алфавита классов и анализа структуры данных;
выделение подклассов или уровней классификации путем
группировки или классификации объектов;
разделение пространства признаков на области, соответствующие
классам, с целью выявления пересекающихся и непересекающихся
областей, которые определяются с помощью гиперсфер и межкластерных
расстояний;
классификация объектов в случае отсутствия какой бы то ни было
информации о количественном и качественном составе классов.
Кроме того, методы кластерного анализа достаточно удобны для
построения иерархической системы классификации многомерных
объектов. Иными словами, если требуется провести классификацию по
нескольким признакам, то производят ранжирование по степени важности
и проводят классификацию по первому
признаку, затем полученные
подклассы разбивают на подклассы по второму и т.д. Подобным образом
строится большинство комбинационных статистических группировок.
К достоинствам методов кластерного анализа следует отнести
широту их применения в различных областях, работоспособность при
полном отсутствии априорной информации об объектах и классах,
возможность классификации многомерных объектов, которые очень
трудно разделить
в пространстве с помощью линейных и нелинейных
функций и т.д.
Однако существенным недостатком методов кластерного анализа
является необходимость вычисления матрицы расстояний, что всегда