ВУЗ:
Составители:
Рубрика:
∑
=
−
=
n
k
k
n
1
1
1
ρρ , (2.15)
которое принимается за пороговое.
В 3-ей строке ищутся максимумы, т.е. такие расстояния, для которых
выполняется неравенство
11 +−
∗∗∗
<
<
kkk
ρ
ρ
ρ
. (2.16)
Все найденные максимальные значения сравниваются с пороговым
ρ
.
Если они превосходят и пороговое, то принимается решение об удалении
соответствующего ребра из построенного дерева . Оставшиеся после этой
процедуры связные фрагменты дерева образуют классы. Перечень объектов
каждого класса определяется по 2-ой строке, находящейся по построению
во взаимнооднозначном соответствии с 3-ей строкой.
Получаемые с помощью кластер-процедур результаты не обладают
достаточной устойчивостью в том смысле, что выбор другой формулы для
расчета расстояний или незначительные изменения правил классификации
могут привести к разным результатам. Поэтому представляет интерес срав-
нительный анализ качества разбиений, получаемых с помощью различных
способов. С этой целью вводят понятие функционала
(
)
SQ
качества раз-
биения
S
, определенного на множестве всех возможных разбиений. Тогда
наилучшим разбиением
∗
S
считается такое, при котором достигается экс-
тремум такого функционала. Рассмотрим наиболее распространенные
функционалы качества разбиения.
Пусть для определения степени сходства выбрана метрика
(
)
ki
xx ,
ρ
в
пространстве
X
и
(
)
m
SSSS ,,,
21
K
=
– некоторое фиксированное разбиение
объектов
n
xxx ,,,
21
K
. Тогда можно записать следующие функционалы ка -
чества разбиения:
§ сумма внутриклассовых дисперсий
() ()
∑∑
=∈
=
m
kSx
ki
ki
xxSQ
1
2
1
,ρ
; (2.17)
§ сумма попарных внутриклассовых расстояний между элементами
классов
()
()
∑∑
=∈
=
m
kSxx
ji
kji
xxSQ
1,
2
,ρ . (2.18)
Эти критерии позволяют в целом оценить качество полученного варианта
классификации и, кроме того, с их помощью можно уточнить классифика -
цию по дереву кратчайших расстояний, перераспределив между классами
вершины, присоединенные к дереву последними.
1 n ρ= ∑ ρk , (2.15) n − 1 k =1 кот орое прин им а ет ся за пороговое. В 3-ей ст роке ищ у т ся м а ксим у м ы, т .е. т а кие ра сстоян ия, д л я кот орых выпол н яет ся н ера вен ст во ρ k ∗ −1 < ρ k ∗ < ρ k ∗ +1 . (2.16) В се н а йд ен н ые м а ксим а л ь н ые зн а чен ия сра вн ива ют ся с пороговым ρ . Е сл и он и превосход ят и пороговое, то прин им а ет ся реш ен ие обу д а л ен ии соответ ст ву ющ его ребра из пост роен н ого д ерева . О ст а вш иеся посл е эт ой процед у ры связн ые ф ра гм ен т ы д ерева обра зу ют кл а ссы. П еречен ь объектов ка ж д ого кл а сса опред ел яет ся по 2-ой ст роке, н а ход ящ ейся по построен ию во вза им н оод н озн а чн ом соот вет ствии с 3-ей строкой. П ол у ча ем ые с пом ощ ь ю кл а ст ер-процед у р резу л ь т а т ы н е обл а д а ют д ост а точн ой у стойчивост ь ю в т ом см ысл е, что выборд ру гой ф орм у л ы д л я ра счет а ра сстоян ий ил и н езн а чит ел ь н ые изм ен ен ия пра вил кл а ссиф ика ции м огу т привест и к ра зн ым резу л ь т а т а м . П оэтом у пред ст а вл яет ин терес сра в- н ит ел ь н ый а н а л из ка чества ра збиен ий, пол у ча ем ых с пом ощ ь ю ра зл ичн ых способов. С эт ой цел ь ю ввод ят пон ят ие фун кци он а ла Q (S ) каче ства раз- би е н и я S , опред ел ен н ого н а м н ож ест ве всех возм ож н ых ра збиен ий. Т огд а н а ил у чш им ра збиен ием S ∗ счит а ет ся т а кое, при кот ором д ост ига ет ся экс- т рем у м т а кого ф у н кцион а л а . Ра ссм от рим н а ибол ее ра спрост ра н ен н ые ф у н кцион а л ы ка чест ва ра збиен ия. П у ст ь д л я опред ел ен ия ст епен и сход ст ва выбра н а м етрика ρ (x i , x k ) в простра н стве X и S = (S1 , S 2 , K , S m ) –н екот орое ф иксирова н н ое ра збиен ие объект ов x1 , x 2 , K , x n . Т огд а м ож н о за писа т ь сл ед у ющ ие ф у н кцион а л ы ка - чества ра збиен ия: § су м м а вн у т рикл а ссовых д исперсий m Q1 (S ) = ∑ ∑ ρ 2 ( xi , xk ) ; (2.17) k =1 xi ∈S k § су м м а попа рн ых вн у т рикл а ссовых ра сст оян ий м еж д у эл ем ен т а м и ∑ ρ (xi , x j ) . m кл а ссов Q2 (S ) = ∑ (2.18) k =1xi , x j ∈S k Э т и крит ерии позвол яют в цел ом оцен ит ь ка чест во пол у чен н ого ва риа н т а кл а ссиф ика ции и, кром е того, с их пом ощ ь ю м ож н о у точн ит ь кл а ссиф ика - цию по д ереву кра т ча йш их ра сстоян ий, перера спред ел ив м еж д у кл а сса м и верш ин ы, присоед ин ен н ые к д ереву посл ед н им и.
Страницы
- « первая
- ‹ предыдущая
- …
- 7
- 8
- 9
- 10
- 11
- …
- следующая ›
- последняя »