Основы теории систем и системного анализа. Матвеев Ю.Н. - 35 стр.

UptoLike

Составители: 

35
Величина
∑∑
==
=
2
1
1
1
214
/),(),(
n
j
n
i
ji
nnYXdYXD
называется средним
расстоянием между кластерами
X
и
Y
.
Рис. 1.8. Различные способы определения расстояния между кластерами
X
и
Y
:
D
1
по ближайшим объектам; D
2
по самым далеким объектам;
D
3
по центрам тяжести
Выбор той или иной меры расстояния между кластерами влияет,
главным образом, на вид выделяемых алгоритмами кластерного анализа
геометрических группировок объектов в пространстве признаков. Так,
алгоритмы, основанные на расстоянии ближайшего соседа, хорошо
работают в случае группировок, имеющих сложную, в частности
цепочечную структуру. Расстояние дальнего соседа применяется, когда
искомые группировки образуют в пространстве
признаков шаровидные
облака. И промежуточное место занимают алгоритмы, использующие
расстояния центров тяжести и средней связи, которые лучше всего
работают в случае группировок эллипсоидной формы.
1.11.3. Расстояние между объектом и классом
Для определения расстояния между объектом и кластером могут
быть сформулированы различные методы.
Особый интерес представляет двухгрупповой метод, предложенный
Сокалом и Миченером
[8]. В данном методе связь между объектом
S
и
классом
K
выражается в виде среднего коэффициента сходства между
объектом
Q и всеми объектами, входящими в класс
K
.
Обозначим объекты, входящие к класс
K
через
K
n
XXX ,...,,
21
, а через
X
центр класса
K
. Тогда, если средний коэффициент сходства выразить
через евклидово расстояние, среднее расстояние
SK
D между объектом
K
S
и всеми объектами из
K
=
=
K
n
j
j
T
j
K
SK
SXSX
n
D
1
)()(
1
. (1.26)
Далее
=
=
+=
=++=
K
K
n
j
T
j
T
j
K
n
j
j
T
j
K
SK
SXSXXXXX
n
SXXXSXXX
n
D
1
1
).()()()(
1
)()(
1
(1.27)
X
Y
D
1
D
2
D
3
Y