ВУЗ:
Составители:
Рубрика:
27
•
внутри групп объекты должны быть тесно связаны между собой;
•
объекты разных групп должны быть далеки друг от друга;
•
при прочих равных условиях распределения объектов по группам
должны быть равномерными.
Первые два требования выражают стандартную концепцию
компактности классов разбиения; последнее требование состоит в том,
чтобы критерий не навязывал объединения отдельных групп объектов.
1.8.2. Общая внутриклассовая дисперсия
Минимизация внутриклассовой дисперсии – это один из самых
распространенных критериев в кластерном анализе, хотя используется
и в
задачах дискриминантного и дисперсионного анализа. Естественная сфера
его применения – выделение кластеров в евклидовом пространстве,
имеющих шарообразную форму.
∑∑
==
=
m
i
n
j
ji
D
11
2
σ
, (1.5)
где
2
ji
σ
– дисперсия j-го признака в i-м классе;
n – число признаков;
m – число классов.
При этом дисперсия каждого признака может быть определена так:
2
2
1
1
2
2
k
x
k
x
k
j
j
k
j
j
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−=
∑
∑
=
=
σ
, (1.6)
где
j
x – признак объекта;
k
– число объектов в классе.
1.8.3. Внутригрупповая сумма квадратов отклонений
Внутригрупповая сумма квадратов отклонений (ВСКО) в общем
виде вычисляется следующим образом:
,)(
12
12
2
2)2()(
1
2
1
2
2
1
2
2
11
2
2
11
2
111
2
2
11111
2
1
2
11
2
1
2
2
1
2
∑∑∑∑∑
∑∑∑∑∑
∑∑∑∑∑
∑∑∑∑∑
=====
=====
=====
=====
−=
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
+
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−=
=
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
+−=
=
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
+−=
=+−=+−=−=
m
i
m
i
ii
m
i
i
m
i
i
m
i
i
m
i
m
i
i
m
i
m
i
m
i
iii
m
i
m
i
m
i
m
i
m
i
ii
ii
m
i
m
i
m
i
ii
m
i
ii
m
i
i
X
m
XX
m
m
X
m
X
X
m
XX
m
X
m
X
m
X
XX
XXXXXXXXXXW
(1.7)
где
i
X представляет собой измерение i-го объекта;
m – число объектов в классе.
Очевидно, что чем меньше ВСКО кластера, тем плотнее объекты
располагаются в кластере и тем больше объекты «схожи» друг с другом.
Страницы
- « первая
- ‹ предыдущая
- …
- 25
- 26
- 27
- 28
- 29
- …
- следующая ›
- последняя »
