ВУЗ:
Составители:
Рубрика:
35
Величина
∑∑
==
=
2
1
1
1
214
/),(),(
n
j
n
i
ji
nnYXdYXD
называется средним
расстоянием между кластерами
X
и
Y
.
Рис. 1.8. Различные способы определения расстояния между кластерами
X
и
Y
:
D
1
– по ближайшим объектам; D
2
– по самым далеким объектам;
D
3
– по центрам тяжести
Выбор той или иной меры расстояния между кластерами влияет,
главным образом, на вид выделяемых алгоритмами кластерного анализа
геометрических группировок объектов в пространстве признаков. Так,
алгоритмы, основанные на расстоянии ближайшего соседа, хорошо
работают в случае группировок, имеющих сложную, в частности
цепочечную структуру. Расстояние дальнего соседа применяется, когда
искомые группировки образуют в пространстве
признаков шаровидные
облака. И промежуточное место занимают алгоритмы, использующие
расстояния центров тяжести и средней связи, которые лучше всего
работают в случае группировок эллипсоидной формы.
1.11.3. Расстояние между объектом и классом
Для определения расстояния между объектом и кластером могут
быть сформулированы различные методы.
Особый интерес представляет двухгрупповой метод, предложенный
Сокалом и Миченером
[8]. В данном методе связь между объектом
S
и
классом
K
выражается в виде среднего коэффициента сходства между
объектом
Q и всеми объектами, входящими в класс
K
.
Обозначим объекты, входящие к класс
K
через
K
n
XXX ,...,,
21
, а через
X
– центр класса
K
. Тогда, если средний коэффициент сходства выразить
через евклидово расстояние, среднее расстояние
SK
D между объектом
K
S
∉
и всеми объектами из
K
∑
=
−−=
K
n
j
j
T
j
K
SK
SXSX
n
D
1
)()(
1
. (1.26)
Далее
∑
∑
=
=
−−+−−=
=−+−−+−=
K
K
n
j
T
j
T
j
K
n
j
j
T
j
K
SK
SXSXXXXX
n
SXXXSXXX
n
D
1
1
).()()()(
1
)()(
1
(1.27)
X
X
Y
D
1
D
2
D
3
Y
Страницы
- « первая
- ‹ предыдущая
- …
- 33
- 34
- 35
- 36
- 37
- …
- следующая ›
- последняя »