Основы теории систем и системного анализа. Матвеев Ю.Н. - 29 стр.

UptoLike

Составители: 

29
∑∑
=+=
=
=
m
i
m
ij
out
m
k
in
D
D
F
11
1
, (1.12)
где
=
Kji
ijin
dD
,
среднее внутриклассовое расстояние;
mколичество классов;
ij
d расстояние между объектами i и j класса k;
nчисло объектов в классе;
∑∑
==
=
2
1
1
1
21
/
n
j
n
i
ijout
nndD среднее расстояние между классами K
1
и K
2
;
ij
d
расстояние между объектами i и j,
21
, KjKi
;
где n
1
число объектов в классе K
1
;
n
2
число объектов в классе K
2.
1.9. Формализация данных
Мера расстояния вычисляется на основании исходных показателей
признаков
nix
i
,1, = , имеющих разную физическую природу и различную
размерность. Для того чтобы их можно было комбинировать, необходимо
представлять данные в таком формате, который бы не влиял на
определения расстояний между объектами. Иными словами необходима
формализация данных, переводящая их в безразмерные величины.
Однако в результате формализации картина классификации может
полностью измениться, как показано
на рис. 1.7.
Рис. 1.7. Расслоение объектов в пространстве двух показателей до (а)
и после (б) нормировки
Здесь при одних масштабах визуально выделяется два кластера
(1,2,3) + (4,5,6), а при другихтри совершенно иных кластера (1,4) + (2,5)+
+ (3,6).
Такие курьезные ситуации описаны в книге [7] и могут иметь место
для всех нормировок, связанных с конкретной выборкой.