ВУЗ:
Составители:
Рубрика:
29
∑∑
∑
=+=
=
=
m
i
m
ij
out
m
k
in
D
D
F
11
1
, (1.12)
где
∑
∈
=
Kji
ijin
dD
,
– среднее внутриклассовое расстояние;
m – количество классов;
ij
d – расстояние между объектами i и j класса k;
n – число объектов в классе;
∑∑
==
=
2
1
1
1
21
/
n
j
n
i
ijout
nndD – среднее расстояние между классами K
1
и K
2
;
ij
d
– расстояние между объектами i и j,
21
, KjKi
∈
∈
;
где n
1
– число объектов в классе K
1
;
n
2
– число объектов в классе K
2.
1.9. Формализация данных
Мера расстояния вычисляется на основании исходных показателей
признаков
nix
i
,1, = , имеющих разную физическую природу и различную
размерность. Для того чтобы их можно было комбинировать, необходимо
представлять данные в таком формате, который бы не влиял на
определения расстояний между объектами. Иными словами необходима
формализация данных, переводящая их в безразмерные величины.
Однако в результате формализации картина классификации может
полностью измениться, как показано
на рис. 1.7.
Рис. 1.7. Расслоение объектов в пространстве двух показателей до (а)
и после (б) нормировки
Здесь при одних масштабах визуально выделяется два кластера
(1,2,3) + (4,5,6), а при других – три совершенно иных кластера (1,4) + (2,5)+
+ (3,6).
Такие курьезные ситуации описаны в книге [7] и могут иметь место
для всех нормировок, связанных с конкретной выборкой.
Страницы
- « первая
- ‹ предыдущая
- …
- 27
- 28
- 29
- 30
- 31
- …
- следующая ›
- последняя »