Основы теории систем и системного анализа. Матвеев Ю.Н. - 28 стр.

UptoLike

Составители: 

28
С учетом того что каждый объект обладает несколькими признаками,
выражение примет вид
∑∑
== =
=
n
j
z
i
z
i
jiji
x
z
x
n
W
11
2
1
2
)(
11
, (1.8)
где
x
ji
j-й признак i-го объекта;
nчисло признаков объекта;
zколичество объектов в классе.
1.8.4. Квадраты внутриклассовых и межклассовых расстояний
Квадраты внутриклассовых расстояний, как и внутриклассовая
дисперсия,
один из самых распространенных критериев кластерного
анализа, хотя может использоваться и в задачах дискриминантного
анализа:
=
Kji
ij
dF
,
2
, (1.9)
где
ij
d расстояние между объектами i и j класса K .
Данный критерий используют для определения размеров классов, а
также сходства объектов внутри класса. При этом чем больше величина
F,
тем больше размер класса и тем меньше сходство объектов в нем.
Часто вместо квадратов внутриклассовых расстояний с целью
выявления компактных удаленных групп объектов
outin
FFF
=
используют средние внутриклассовые и межклассовые расстояния [7]:
=
=
k
l
l
Kji
ij
in
n
d
F
l
1
2
,
, (1.10)
где
in
F
среднее внутриклассовое расстояние;
l
n число объектов
l
класса;
k
число классов;
ij
d расстояние между объектами i и j класса
l
S
.
<
=
ql
ql
KjSi
ij
out
nn
d
F
lq
,
, (1.11)
где
out
F
среднее межклассовое расстояние;
ql
nn , – число объектов
l
и q классов соответственно;
ij
d расстояние между объектами i и j классов
l
S
и
q
S .
В качестве показателя эффективности, отражающего основные
требования классификации с точки зрения кластерного анализа,
используют отношение суммы средних внутриклассовых расстояний к
сумме средних межклассовых.