Основы теории систем и системного анализа. Матвеев Ю.Н. - 27 стр.

UptoLike

Составители: 

27
внутри групп объекты должны быть тесно связаны между собой;
объекты разных групп должны быть далеки друг от друга;
при прочих равных условиях распределения объектов по группам
должны быть равномерными.
Первые два требования выражают стандартную концепцию
компактности классов разбиения; последнее требование состоит в том,
чтобы критерий не навязывал объединения отдельных групп объектов.
1.8.2. Общая внутриклассовая дисперсия
Минимизация внутриклассовой дисперсииэто один из самых
распространенных критериев в кластерном анализе, хотя используется
и в
задачах дискриминантного и дисперсионного анализа. Естественная сфера
его применениявыделение кластеров в евклидовом пространстве,
имеющих шарообразную форму.
∑∑
==
=
m
i
n
j
ji
D
11
2
σ
, (1.5)
где
2
ji
σ
дисперсия j-го признака в i-м классе;
n число признаков;
m число классов.
При этом дисперсия каждого признака может быть определена так:
2
2
1
1
2
2
k
x
k
x
k
j
j
k
j
j
=
=
=
σ
, (1.6)
где
j
x признак объекта;
k
число объектов в классе.
1.8.3. Внутригрупповая сумма квадратов отклонений
Внутригрупповая сумма квадратов отклонений (ВСКО) в общем
виде вычисляется следующим образом:
,)(
12
12
2
2)2()(
1
2
1
2
2
1
2
2
11
2
2
11
2
111
2
2
11111
2
1
2
11
2
1
2
2
1
2
∑∑
∑∑∑∑
∑∑
∑∑
=====
=====
=====
=====
=
+
=
=
+=
=
+=
=+=+==
m
i
m
i
ii
m
i
i
m
i
i
m
i
i
m
i
m
i
i
m
i
m
i
m
i
iii
m
i
m
i
m
i
m
i
m
i
ii
ii
m
i
m
i
m
i
ii
m
i
ii
m
i
i
X
m
XX
m
m
X
m
X
X
m
XX
m
X
m
X
m
X
XX
XXXXXXXXXXW
(1.7)
где
i
X представляет собой измерение i-го объекта;
m число объектов в классе.
Очевидно, что чем меньше ВСКО кластера, тем плотнее объекты
располагаются в кластере и тем больше объекты «схожи» друг с другом.